大家好,今天来为您分享决策树分析法的主要思路是什么 决策树分析法的一些知识,本文内容可能较长,请你耐心阅读,如果能碰巧解决您的问题,别忘了关注本站,您的支持是对我们的最大鼓励!

决策树分析法是一种常用的决策支持工具,它以树状结构的方式呈现,通过对备选方案进行一系列的判断和选择,最终得出最佳的决策结果。其主要思路可以概括为以下几个步骤。

决策树分析法的主要思路是什么 决策树分析法

决策树分析法需要明确决策的目标和背景。在决策树中,目标通常表示为一个根节点,决策者需要明确自己的目标是什么,以及决策的背景和限制条件是什么。

决策者需要确定决策的因素和备选方案。决策树分析法将决策问题看作是一个有向无环图,图中的节点表示决策因素,边表示决策因素之间的依赖关系。决策者需要根据自己的经验和知识确定决策因素,并列出备选方案。

决策者需要对决策因素进行评价和权重分配。每个决策因素都有不同的重要性,决策者需要根据自己的判断对决策因素进行评价,并为其分配权重。这可以通过专家评估、数据分析或者主观判断等方式进行。

通过构建决策树来分析备选方案。决策树由一系列的节点和边组成,节点表示决策因素或决策结果,边表示决策因素之间的关系。决策树的构建可以通过逐步判断各个决策因素的子因素来实现,最终得出最佳的决策结果。

决策者需要对决策树进行评估和验证。评估和验证的目的是检验决策树的有效性和合理性,以及分析决策结果的稳定性和可靠性。如果决策者对决策结果不满意,可以对决策树进行调整和改进。

总结来说,决策树分析法的主要思路是通过明确决策目标和背景,确定决策因素和备选方案,进行评价和权重分配,构建决策树来分析备选方案,并对决策树进行评估和验证。这种方法简单直观,易于理解和使用,并且能够帮助决策者做出更准确、科学和有效的决策。

决策树分析法的主要思路是什么 决策树分析法

如下:

决策树分析法是指分析每个决策或事件(即自然状态)时,都引出两个或多个事件和不同的结果,并把这种决策或事件的分支画成图形,这种图形很像一棵树的枝干,故称决策树分析法。选择分割的方法有好几种,但是目的都是一致的:对目标类尝试进行最佳的分割。

一般都是自上而下的来生成的。每个决策或事件(即自然状态)都可能引出两个或多个事件,导致不同的结果,把这种决策分支画成图形很像一棵树的枝干,故称决策树。  决策树就是将决策过程各个阶段之间的结构绘制成一张箭线图。优点:

1、可以生成可以理解的规则;

2、计算量相对来说不是很大;

3、可以处理连续和种类字段;

4、决策树可以清晰的显示哪些字段比较重要。

决策树分析法例题

某厂区建设项目,共分道路(甲)、厂房(乙)、办公楼(丙)3个标段进行招标建设,投标人只能选择其中一个标段参与投标。预期利润及概率见下表。若未中标,购买招标文件、图纸及人工费、利息支出合计为5000元。 方案及结果 中标、落标概率 效果 预期利润(万元) 预期利润概率 甲标段高价中标 0.2 赚 200 0.3 一般 50 0.6 赔 -20 0.1 甲标段高价落标 0.8 赔 -0.5 / 甲标段低价中标 0.4 赚 160 0.2 一般 40 0.6 赔 -30 0.2 甲标段低价落标 0.6 赔 -0.5 / 乙标段高价中标 0.3 赚 250 0.2 一般 80 0.7 赔 -30 0.1 乙标段高价落标 0.7 赔 -0.5 / 乙标段低价中标 0.5 赚 200 0.1 一般 60 0.7 赔 -40 0.2 乙标段低价落标 0.5 赔 -0.5 / 丙标段高价中标 0.1 赚 300 0.3 一般 100 0.5 赔 -40 0.2 丙标段高价落标 0.9 赔 -0.5 / 丙标段低价中标 0.3 赚 240 0.2 一般 70 0.5 赔 -50 0.3 丙标段低价落标 0.7 赔 -0.5 / 解:(1)绘制决策树

依据表格数据绘制决策树,并将方案标于方案枝,概率标于概率枝,预期利润标于终点,见图5-1;

(2)计算损益期望值

计算各节点处的损益期望值,E=∑ G·P,并标注于相应的节点上方,

E7 = 200 × 0.3+50 × 0.6+(-20) × 0.1 = 88, E1 = 88 × 0.2+(-0.5) × 0.8 = 17.2,

E8 = 160 × 0.2+40 × 0.6+(-30) × 0.2 = 50, E2 = 50 × 0.4+(-0.5) × 0.6 = 19.7,

E9 = 250 × 0.2+80 × 0.7+(-30) × 0.1 = 103, E3 = 103 × 0.3+(-0.5) × 0.7 = 30.55,

E10 = 200 × 0.1+60 × 0.7+(-40) × 0.2 = 54, E4 = 54 × 0.5+(-0.5) × 0.5 = 26.75,

E11 = 300 × 0.3+100 × 0.5+(-40) × 0.2 = 132, E5 = 132 × 0.1+(-0.5) × 0.9 = 12.75,

E12 = 240 × 0.2+70 × 0.5+(-50) × 0.3 = 68, E6 = 68 × 0.3+(-0.5) × 0.7 = 20.05;

(3)比较各方案节点的损益期望值

max {E1,E2,E3,E4,E5,E6} = max {17.2,19.7,30.55,26.75,12.75,20.05} = E3;

(4)结论

节点3的期望值最大,故从损益期望值的角度分析,应选乙标段投标并以高价报价最为有利。

决策树分析法适用于什么决策

决策树法就是把决策过程用树状图来表示。

树状图一般是由决策点、方案分枝、自然状态点、概率分枝和结果点几个关键部分构成。树状图表现了两种不同的决策环节,一种是主观抉择环节,另一种是客观抉择环节。决策树法适用于风险型决策。

决策树分析法的主要思路是什么

(一)决策内容

所谓油气勘探决策分析,就是在油气资源评价分析基础上,将勘探对象、勘探方案和勘探结果三者紧密结合起来,进行风险分析和效益(经济效益、社会效益)分析,研究不同勘探可能产生的种种结果,从而遴选出最满意的勘探方案,为合理部署勘探工作提供依据。

油气勘探决策可依据决策对象不同而分出不同的层次,各层次的决策思路和内容是不尽相同的。概略而言,油气勘探决策的最高层次是国家石油工业战略方针决策,主要是根据国民经济发展的能源总体需求、国家能源结构、全国可动油气储量、资源量及其分布、国际油气价格、外交及军事战略、就业问题等,确定中长期石油工业发展方针政策、勘探投资总额和勘探工作总体布局。第二层次是区域勘探决策,主要是据区域油气资源量、勘探程度、勘探成本及油气市场供求关系、油气价格,分析进一步勘探的可能经济效益和社会效益,决策是否对该区域进行勘探,确定投资强度。第三层次是勘探目标选择,主要是在圈闭资源评价基础上,开展风险分析,研究勘探条件,估计各种勘探方案及其可能产生的勘探结果的投入产出,根据经济效益大小对一批勘探目标(即局部构造、潜山、岩性体、成岩体等)进行排队,确定哪些先勘探,哪些暂缓勘探及哪些不勘探。最低层次的决策是井位布置,在经济效益分析基础上,确定勘探目标的经济边界含油气面积(即低于此面积则不值得进一步勘探),按探井应钴在经济边界含油气面积边缘的原则,根据实际地质条件布井。

松辽盆地是我国最重要的油气工业基地之一,著名的大庆油田目前几乎支撑着全国油气生产的半边天。从全盆地油气赋存状况看,东南隆起区是盆内主要产气区,当地乃至整个东北的能源供需现实,有力地说明东南隆起区的天然气开发生产有利于改善区域能源消费结构,满足长春、四平及其它大中城市工业发展和民用的急需。研究区是盆地东南隆起区的最有利区块,现已有后五家户.小五家子、万金塔、农安、八屋和艾家窝堡等气田和含气构造投入开发,初步建立起天然气生产基地和供应市场,有关部门正在加大投资力度,扩大勘探。在工区内的勘探决策已不是区域选择这一层次,而是勘探目标选择这一层次。

在勘探决策分析中,勘探对象、勘探方案和勘探结果是一体化定量研究的三大组成部分,其中勘探方案起到连接勘探对象和勘探结果的桥梁作用,它也是唯一能人为控制的部分。对于勘探目标而言,最主要的勘探手段就是钻探,其它勘探研究工作是为其服务的。在勘探目标选择这一决策层次中,我们把勘探方案定义为一组勘探目标的钻探序列,即钻探先后序次。对于一组勘探目标,钻探先后顺序不同,就是勘探方案不同。由于研究区内各勘探目标的含油气性及资源量不同,所以不同的方案会产生不同的勘探结果,从中选择最佳方案即是本书决策分析的主要内容。

(二)决策思路

决策的基本思路是:以经济效益为决策准则,在前面天然气资源评价专家系统圈闭含气性评价和圈闭资源量计算基础上,以局部构造为勘探目标(或叫勘探对象),逐一进行风险分析,分析钻第一、二口探井时将出现哪些勘探结果及其可能性,然后依据勘探开发成本和天然气产量、价格等计算经济效益期望值,最后按各局部构造经济效益期望值进行排序,提出一个最佳勘探方案。

(三)决策方法

为实现上述思路,我们选择程学福等(1994)研制的天然气资源勘探决策系统决策树分析法。下面简单介绍决策树分析法。

1.决策树概念:对于一个局部构造,是立即钻探呢还是先作物探等准备工作后再钻井?第一口探井可能找到一个大气田,或中气田,或小气田,更可能是干井;当为干井时还打第二口探井否?第二口探井又可能出现上述几种结果。这是一个围绕具体勘探目标的更深层次决策过程,其中包含着许多逻辑分析和计算,可以用一个树模型图来表示(图9—1):方框是决策节点,从它引出的每条支线就是一个方案;圆框是自然状态集节点,从它引出的支线分别代表一种可能出现的结果,支线上数据表示该结果出现的概率。图9—1 决策树模型图

当进行局部构造选择这一级决策时,就需要对每个局部构造所有勘探方案及其结果进行综合考虑。但问题是用什么指标来表示综合考虑的结果,以便于局部构造排序。该决策树方法中所用的指标是经济效益期望值,并将其定义为所有可能出现结果的经济效益与其出现概率乘积之代数和。经济效益期望值表示了对多种情况的“综合”,是一种把风险和不确定性与经济因素统一起来的有意义的决策准则,其大于零代表有效益,等于零代表无损益,小于零代表亏损。我们即根据此指标来判断各局部构造的勘探效益优劣,从而进行决策。

2.决策树模型:天然气资源勘探决策系统针对局部构造目的层多寡,设计了三个决策树模图型。

Ⅰ型决策树模型是针对只有一个目的层的局部构造设计的,其基本结构见图9—1。对所有方案的限定是第一、第二口探井均为干井时即放弃该构造,故为二级决策树。当探井为发现井时,即只有该目的层为气藏一种情况,其资源量大小是考虑的主要方面之一。

解上决策树,得:含油气盆地分析与资源评价:以松辽盆地十屋-德惠地区为例

式中:X1——平均干井费用;

X2——平均发现井费用;

X3——平均开发井费用;

X4——平均开发井密度:

Y1——采收率;

Y2——油气价格;

A——圈闭含油气面积;

n——资源划分区间数;

Qi、Pi——资源量第i区间的左端点值及资源量落入该区间的概率。

根据上述各式计算值,即可解得:含油气盆地分析与资源评价:以松辽盆地十屋-德惠地区为例

这些就是决策分析的结果。

Ⅱ型决策树模型是针对具有两个目的层的局部构造设计的,也采用“二级”决策树,树结构及解法与l型决策树模型相似,只是所发现的资源量有三种情况:第一个目的层有油气而第二个没有油气;第二个目的层有油气而第一个没有油气;两个目的层均有油气。

Ⅲ型决策树模型是针对具有三个目的层的局部构造设计的,由于有三个目的层,故采用“三级”决策树,其构型与Ⅰ型决策树相似,只不过多了一级而已,且发现井所发现的可能有七种情况:第一个目的层有油气;第二个目的层有油气;第三个目的层有油气;第一、二两个目的层有油气;第二、三两个目的层有油气;第一、三两个日的层有油气;三个目的层均有油气。

3.风险估计:在上述三个决策树模型中,一个重要的问题是估计探井的风险。系统地提出了估计第一、二、三口井为干井的概率(即风险)的方法:

第一口探井风险  第二口探井风险  第三口探井风险  式中:P0——局部构造含油气的概率;

C1——第一口探井的发现系数,C1=1时表示第一口探井为发现井的概率等于局部构造含气概率;

C2——第二口探井的发现系数,C2=(1.1~1.5)C1;

C3——第三口探井的发现系数,C3=(1.1~1.5)C2。

什么是决策树分析法

决策树(Decision Tree)常用于研究类别归属和预测关系的模型,比如是否抽烟、是否喝酒、年龄、体重等4项个人特征可能会影响到‘是否患癌症’,上述4项个人特征称作‘特征’,也即自变量(影响因素X),‘是否患癌症’称为‘标签’,也即因变量(被影响项Y)。决策树模型时,其可先对年龄进行划分,比如以70岁为界,年龄大于70岁时,可能更容易归类为‘患癌症’,接着对体重进行划分,比如大于50公斤为界,大于50公斤时更可能划分为‘患癌症’,依次循环下去,特征之间的逻辑组合后(比如年龄大于70岁,体重大于50公斤),会对应到是否患癌症这一标签上。

决策树是一种预测模型,为让其有着良好的预测能力,因此通常需要将数据分为两组,分别是训练数据和测试数据。训练数据用于建立模型使用,即建立特征组合与标签之间的对应关系,得到这样的对应关系后(模型后),然后使用测试数据用来验证当前模型的优劣。通常情况下,训练数据和测试数据的比例通常为9:1,8:2,7:3,6:4或者5:5(比如9:1时指所有数据中90%作为训练模型使用,余下10%作为测试模型好坏使用)。具体比例情况似研究数据量而定无固定标准,如果研究数据较少,比如仅几百条数据,可考虑将70%或者60%,甚至50%的数据用于训练,余下数据用于测试。上述中包括模型构建和模型预测两项,如果训练数据得到的模型优秀,此时可考虑将其进行保存并且部署出去使用(此为计算机工程中应用,SPSSAU暂不提供);当决策树模型构建完成后可进行预测,比如新来一个病人,他是否会患癌症及患癌症的可能性有多高。

决策树模型可用于特征质量判断,比如上述是否抽烟、是否喝酒、年龄、体重等4项,该四项对于‘是否患癌症’的预测作用重要性大小可以进行排名用于筛选出最有用的特征项。

决策树模型的构建时,需要对参数进行设置,其目的在于构建良好的模型(良好模型的标准通常为:训练数据得到的模型评估结果良好,并且测试数据时评估结果良好)。需要特别注意一点是:训练数据模型评估结果可能很好(甚至准确率等各项指标为100%),但是在测试数据上评估结果确很糟糕,此种情况称为‘过拟合’。因而在实际研究数据中,需要特别注意此种情况。模型的构建时通常情况下参数设置越复杂,其会带来训练数据的模型评估结果越好,但测试效果却很糟糕,因而在决策树构建时,需要特别注意参数的相关设置,接下来会使用案例数据进行相关说明。SPSSAU的操作如下:训练集比例默认选择为:0.8即80%(150*0.8=120个样本)进行训练决策树模型,余下20%即30个样本(测试数据)用于模型的验证。多数情况下,会首先对数据进行标准化处理,处理方式一般使用为正态标准化,此处理目的是让数据保持一致性量纲。当然也可使用其它的量纲方式,比如区间化,归一化等。

接着对参数设置如下:节点分裂标准默认为gini系数(该参数值只是计算分裂标准的方式,不需要设置),节点划分方式为best法,即为结合特征的优劣顺序进行分类划分,如果为了设置参数对比需要考虑,建议可对该参数值进行切换为random即随机特征的优先顺序,用于对比模型训练效果。

节点分列最小样本量默认为2即可,叶节点最小样本量默认为1即可。需要注意的是:如果数据量较大时,建议将该2个参数值尽量大,以减少过拟合现象,但该2个参数值越大时通常训练模型的拟合效果越差。具体应该以测试数据的拟合效果为准,因为训练模型容易出现过拟合现象。树最大深度这个参数时,其代表决策树最多有几层的意思,该参数值设置越大时,训练模型拟合效果通常越好,但可能带来过拟合情况,本案例出于演示需求,先设置为4层。(另提示:树最大深度会受到节点分裂最小样本量、叶节点最小样本量的影响,并非设置为4它一定就会为4)。

SPSSAU部分结果示例:

文章到此结束,如果本次分享的决策树分析法的主要思路是什么 决策树分析法的问题解决了您的问题,那么我们由衷的感到高兴!