基于两维语义的证据推理方式研究

1. 为什么需要举行识别框架间的转化

由于问题的差别和证据处置职员知识靠山及偏好的差别,统一个证据处置职员在对差别问题,差别的证据处置职员针对统一个问题,都可能构建多个差别的识别框架。这些识别框架中包罗的元素的数目、元素寄义等方面可能有所差异,识别框架之间的逻辑关系也可能差别。

而证据推理方式需要在统一个识别框架下对多批证据举行融合,为此,需要对多个识别框架举行分类,并确定识别框架等价及其相互之间的转化方式。

 

2. 识别框架的分类

0x1:识别框架的分类

一样平常来说,识别框架的类型差别,信息处置方式也差别。每种识别框架就代表了一种看待目的工具的抽象视角。

就单个识别框架来说,凭据识别框架中元素的差别,可以将识别框架分为多种类型。

1、平行框架

设 Θ1,Θ2,…..,Θ为 n 个差别的识别框架,若这 n 个框架划分从差别的角度处置统一个问题,则称这 n 个框架为平行框架。

基于两维语义的证据推理方式研究

例如,在风险评估时,甲对某个指标对照熟悉,他对该指标所反映的风险水平构建识别框架:

Θ = {低、较低、中、较高、高} 

并给出了响应的信度函数。

而乙对该指标的熟悉水平相对较弱,构建的风险水平识别框架为:

Θ = {低、中、高} 

也给出了响应的信度函数。

可以看出,由于专家自身知识靠山和小我私家偏好的差别,对统一个问题组织的识别框架也差别,此时的识别框架 Θ 和 Θ 为两个平行框架。

一样平常来说,平行框架是针对统一个问题差别方面,或差别信息源针对统一问题某个方面而构建的,其特征和观点是相容的,通常有公共的精致框架,故平行框架是相容框架

笔者思索

对于平安数据剖析来说,一项基础事情就是所谓的日志采集,例如历程启动日志、历程网络外连日志、历程写文件日志、文件落盘日志。这些差别的日志代表了当前系统行为的一个形貌切面。从识别框架的角度来看,基于差别的日志可以抽象为差别的离散状态集(聚集中的每一个状态代表了一个系统状态形貌)

2、递进框架

设 Θ1,Θ2,…..,Θ为 n 个差别的识别框架,若这 n 个框架中后一个识别框架中的元素用来修饰(说明)前一个识别框架中的元素。

  • 第一层识别框架用于抽象形貌待处置问题;
  • 第二层识别框架用于形貌第一层识别框架的可信度;
  • 今后类推..

则称这 n 个框架为 n 维递进框架。

基于两维语义的证据推理方式研究

例如,在科学基金立项评审的偕行评议表中,“综合评价”和“熟悉水平”可以看做一个两维递进识别框架。

  • “综合评价”是第一层识别框架,Θ1 = {优、良、中、差} 
  • “熟悉水平”是第二层识别框架,Θ2,用来修饰说明专家给出的“综合评价”的不确定水平 

3、夹杂框架

设 Θ1,Θ2,…..,Θ为 n 个差别的识别框架,若这 n 个框架中并列框架和递进框架并存,则称这 n 个框架为夹杂框架。

例如,在科学基金立项评审的偕行评议表中,“综合评价”、“资助意见”、“熟悉水平”三个框架本质上是一组夹杂框架,

  • “综合评价”、“资助意见”是两个平行框架
  • “熟悉水平”是用来修饰“综合评价”和“资助意见”的

在多个识别框架的构建历程中,平行框架通常是针对决议问题属性的特点或决议者凭据自己的知识靠山和偏好而构建的;而递进框架通常是用来反映决议主体与决议历程特征信息的,往往反映了决议者给出的决议信息质量

 

3. 识别框架的等价性

0x1:识别框架等价界说

为了便于将差别识别框架上的信息举行融合,一样平常要求将差别识别框架上的信息转化到统一个识别框架上,为此,需要对差别识别框架的等价性和评估等价的观点举行界定。

设两个识别框架划分为 Θ = {θn,n=1,2,….,N1} 和 Ω = {ωn,n=1,2,….,N2},若对基于两维语义的证据推理方式研究,都存在唯一的 ωn 与之等价,记为:

基于两维语义的证据推理方式研究

反之,若对基于两维语义的证据推理方式研究,都存在唯一的 θn ∈ Θ 与之等价,则称识别框架 Θ 和 Ω 等价(一正一反都建立),记为:

基于两维语义的证据推理方式研究

例如,在对汽车的发动机的噪声举行评价时,存在两个识别框架,

  • 识别框架 Θ = {异常吵、吵、一样平常、静、异常静}
  • 识别框架 Ω = {差、较差、中、良、优}

两个识别框架的元素,都相互存在唯一的等价元素,则识别框架 Θ 和 Ω 等价

显然,若识别框架  Θ 和 Ω 等价,则有 N1 = N2

设 Θ 和 Ω 为两个等价的识别框架,且在两个识别框架下的基本可信度分配划分为:

基于两维语义的证据推理方式研究 

则当且仅当 N1 = N2 且 β1,n = γ2,n 建立时(n=1,2,…,N1),称两个基本可信度分配 m1 与 m2 等价,记为

基于两维语义的证据推理方式研究

0x2:识别框架元素间概率等价

这里需要注重的是,实际情形中,完全等价的识别框架是对照少见的,而是相互错位的,即相互相容而又不完全一一对应(N1 ≠ N2),且一个框架中的元素(θ ∈ Θ)并不一定正好对应于另一个框架中的某个元素(ω ∈ Ω),而是以一定水平对应于另一框架中多个元素。

为此,这里给出识别框架元素间概率等价的观点界说。

若 θ1,n ∈ Θ 以 α2,l(l=1,2,….,N2) 的水平对应于 ωl ∈ Ω,其中

0 ≤ α2,l ≤ 1,基于两维语义的证据推理方式研究,即知足概率完整性

则称框架 Θ 中的元素 θ1,n 与框架 Ω 中的元素集 {(ωl,α2,l),l=12,….,N2} 以概率等价,记为:

基于两维语义的证据推理方式研究

在多属性群决议中,上述等价关系通常是由决议者提供的,其中意味着元素 θ1,n ∈ Θ 的效用和 {(ωl,α2,l),l=12,….,N2} 的期望效用

基于两维语义的证据推理方式研究 

相等。

若对基于两维语义的证据推理方式研究,均有基于两维语义的证据推理方式研究;反过来,对基于两维语义的证据推理方式研究,均有基于两维语义的证据推理方式研究,则称识别框架 Θ 和 Ω 以概率等价,记为:

基于两维语义的证据推理方式研究

0x3:识别框架之间等价关系的逻辑分类

因此,从逻辑关系上来说,识别框架可以分为:

  • 平行框架
  • 递进框架
  • 夹杂框架

从转化关系(等价关系)来说,有

  • 粗化 
  • 细化
  • 概率转化

 

4. 两维语义信息的示意及融合方式

传统的基于单层识别框架的决议在信息的示意上,未能反映决议者提供的决议信息的质量,因此信息对多个意见的合成具有重要作用,直接影响了决议质量。也就是所谓的训练样本的纯度和厚实度决议了模子的最终效果。

因此,有需要增添一维信息反映专家决议知识和行为特征,并对原有决议信息举行修正,以加倍正确有效地行使专家信息。

我们本章来讨论两维语义信息的语义示意及集结方式。

0x1:两维语义信息的内在

设 Hn(n=1,2,…,N) 和 St(t=1,2,…,T) 划分为预先界说好的语言评价集 H 和 S 中的第 n 个和第 t 个元素,其中 Hn 和 St 知足以下几个特征:

  • 有序性:当 i > j 时,基于两维语义的证据推理方式研究基于两维语义的证据推理方式研究
  • 极大化运算和极小化运算:当基于两维语义的证据推理方式研究时,有 max(Hi,Hj) = Hi,max(Si,Sj) = Si,min(Hi,Hj) = Hj,min(Si,Sj) = Sj

对一个讯断问题,决议者同时构建了两个识别框架(语言短语集)H = {H1,H2,….,HN} 和 S = {S1,S2,….,ST},使用了一、二两个维度识别框架中的评价信息形貌自己对于某一事物的评判。

  • 其中第一维识别框架中的评价信息 Hn(n=1,2,….,N) 是用来形貌待决议工具属性的,是对决议工具属性的评价
  • 第二维识别框架中的评价信息 St(t=1,2,….,T) 是用来反映决议者知识证据的属性特征的,是对第一维评价信息 Hn 质量的评价

这种由两个维度形成的语言评价信息 (Hn,St) 称为两维语义评价信息

例如,在国家自然科学基金立项评估中,偕行评议意见表中预先构建了两个语言评估框架:

  • 专家科研项目质量的评价:Hn = {H4(优),H3(良),H2(中),H1(差)}
  • 反映偕行专家对自己给出质量评价 Hn 的评价:S = {S3(熟悉),S2(较熟悉),S1(部门熟悉)}

偕行评议专家提供评价信息 (Hn,St)(n=1,2,3,4; t=1,2,3) 即为两维语义评价信息。 

在两维语义评价信息中,第二维评价信息是用来形貌第一维评价信息质量的,通过第二维语义评价信息,不仅能够反映决议者评价信息的质量,同时也能反映决议信息的不确定和不完全水平。

例如,偕行评议专家提供评价信息 (优,较为熟悉) 即为两维语义信息的一个实例,

  • 第一维评价信息”优“是评议专家对科研项目的评价
  • 第二维评价信息”较熟悉“反映了评议专家对自己给出的评价”优“的不确定水平,同时也反映了评议专家对该科研项目的未知水平(不完全水平)

0x2:两维语义信息的语义示意

由于两维语义信息不仅能够反映决议者评价信息的质量,同时也能反映决议信息的不确定和不完全水平。

同时我们知道,证据理论用信度函数示意证据,信度函数知足半可加性,它比概率函数能更适当示意信息中的”不确定性“和”不知性“。因此,两维语义信息的语义,可用信度函数来示意,即可用证据理论中的证据体来示意两维语义评价信息。

1、两维语义的点信度语义示意

设 H = {H1,H2,….,HN} 和 S = {S1,S2,….,ST} 划分为一、二两个维度上的语言集,将语言集 H 视为证据理论中的识别框架,则两维语义信息 (Hn,St) 的语义可通过映射 f 示意为证据体:

基于两维语义的证据推理方式研究

其中,βtk 代表一个点信度,示意两维语义信息 (Hn,St) 支持 Hk ∈ H(k=1,2,…,N) 为真的置信度,且知足:

基于两维语义的证据推理方式研究,即信度分配函数的完整性

则称 f 为两维语义的点信度示意函数

2、两维语义的点信度语义规则

两维语义的点信度示意函数可由多个专家基于领域履历得出,也可以通过数据驱动的方式从大样本中得出(例如神经网络)。

一样平常来说,两维语义的点信度函数遵照以下规则:

  • 不完全信息规则:第二维语义中对第一维信息质量的评价越高,决议者的评价信息中含有的不完全信息水平就越低,即若基于两维语义的证据推理方式研究,则基于两维语义的证据推理方式研究
  • 信度单峰规则:(Hn,St) 转化成的证据体 {(Hk,βtk),k=1,2,….,N},其信度应以 Hn 为单峰,且距离 Hn 越远,其信度就越小。即对基于两维语义的证据推理方式研究,有基于两维语义的证据推理方式研究,且若 | i-n | < | j-n |,则有 βt(Hi) > βt(Hj),其中 i,j ∈ {1,2,….,N}

3、两维语义的区间信度示意

两维语义的点信度示意法要求给出两维语义支持各语言评价品级的正确置信度,这对决议者的领域知识或者有监视样本集的要求较高。

然则由于客观事物的庞大性(相关性不明显,或者伪相关性)和人类自身知识的局限性,两维语义的区间信度比正确的点信度示意更容易获取。

针对两维语义信息 (Hn,St) 的语义,假设专家用映射 g 示意区间信度:

基于两维语义的证据推理方式研究

其中,基于两维语义的证据推理方式研究代表一个区间信度,示意两维语义信息 (Hn,St) 支持 Hk ∈ H(k=1,2,…,N) 为真的置信度,且知足:

基于两维语义的证据推理方式研究,同样需要知足信度分配函数的完整性 

则称 g 为两维语义的区间信度示意函数。 

Java 虚拟机中的运行时数据区分析

类似的,两维语义的区间信度示意法也同样遵照”不完全信息“和”信度单峰“语义规则。

0x3:两维语义信息的对照

由两位语义信息 (Hn,St) 的信度示意法可知,两维语义信息不仅反映了决议者看待处置问题的评价,同时反映了决议信息的质量(包罗决议信息的不确定性和不完全性),因此对两维语义信息举行对照,关键是若何处置不确定和不完全信息。

对于两维语义的点信度示意法,可以接纳两种处置方式:

  • 点期望得分法
  • 区间期望得分法

对于两维语义的区间信度语义示意法,可行使基于延续的有序加权平均算子(continuous ordered weighted averaging,C-OWA)算子的区间信度的点化法,将区间信度转化为点信度,再举行对照。

1、点期望得分法

点期望得分法将两维语义中的第一个维度上的语言短语量化为得分,通过两维语义的证据体示意中的信度盘算两维语义信息的加权平均得分。

设第一个维度上的语言集 H = {H1,H2,….,HN},且基于两维语义的证据推理方式研究(i < j),(Hn,St) 的点信度语义为基于两维语义的证据推理方式研究。假设语言短语 Hi 的得分为 hi,知足 hi < hj(i < j)。与加权平均法类似,可界说两维语义信息的期望得分 E[(Hn,St)]:

基于两维语义的证据推理方式研究

由证据体示意的两维语义信息,通过期望得分化为得分值,从而可将多个两维语义信息举行对照、排序。这种方式盘算简朴,但瑕玷是处置历程有损失。

2、区间期望得分法

区间期望得分法首先也将两维语义中的第一个维度上的语言短语量化为得分,当 βt(H)>0时,为了便于多个两维语义信息对照,将这部门信度划分赋予最小分值和最大分值,由此,发生一个得分区间。

设第一个维度上的语言集 H = {H1,H2,….,HN},且基于两维语义的证据推理方式研究(i < j),(Hn,St) 的点信度语义为基于两维语义的证据推理方式研究。假设语言短语 Hi 的得分为 hi,知足 hi < hj(i < j)。

基于两维语义的证据推理方式研究时,说明由于人们对问题的不确知而将这一部门信度赋予了整个框架。为了便于对照,将这部门信度划分赋予 min(H1,H2,…,HN) = H1,max(H1,H2,…,HN) = H1。则两维语义信息 (Hn,St) 的最小、最大期望得分划分为: 

基于两维语义的证据推理方式研究

从而可得两维语义信息 (Hn,St) 的期望得分区间:

[minE[(Hn,St)],maxE[(Hn,St)]]

这种信度分配方式很容易明白,由于由于信息的不完全或人们熟悉能力的局限性,信度 βt(H) 不知该分配到哪个评语上,但无论这部门信度若何分配,两维语义信息 (Hn,St) 的期望得分均落在上述区间中。

显然,当 β1(H) = 0 时,上述区间退化成一个点;而当 βt(H) = 1 时,即当人们对问题完全无知时,该区间就退化为 [h1,hN]。

凭据区间数的可能度公式可对多个两维语义信息举行对照、排序。

相比点期望得分法,得分区间法盘算较庞大,但效果更正确,处置历程中信心损失较少。

0x4:两维语义信息的集结

凭据两位语义信息的语义示意,对多个两维语义信息的集结转化成了对多条证据的集结。

现在,证据的融合方式主要有:

  • Dempster合成规则
  • 改善的冲突证据合成规则
  • 证据推理算子 

Dempster合成规则在处置高度冲突的证据时,其效果往往有悖常理,例如著名的Zadeh悖论

改善的冲突证据合成规则从差别的角度对Dempster合成规则举行了改善,并且在某些领域取得了较好的应用,但处置的冲突证据都有一定应用靠山和使用哦局限限制,且在处置差别权重信息的证据方面也存在一定的难题。

而证据推理方式是由Yang等人在1994年提出来的,后又对此举行了完善和生长。该方式应用权重修正证据源,并在合成历程中对未分配的信度进一步细分为由权重引起的不完全和由信息源给出的判断不完全两部门。证据推理合成规则在处置差别权重的多条证据的融合方面具有怪异的优势,且能很好地处置高度冲突的证据合成问题。

由于差别的两维语义信息的质量差别,其在信息融合的重要性也不相同,即差别两维语义信息的权重差别,且多个两维语义信息也存在高度冲突情形。因此,我们通过引入证据推理算子对多个两维语义信息举行融合。

设有 p 个信息源给出的两维语义评价信息为:

基于两维语义的证据推理方式研究

其点信度语义示意为:

基于两维语义的证据推理方式研究

其中,基于两维语义的证据推理方式研究为第 i 个信息源 Ei 支持评价工具评为品级 Hn 的置信水平,且知足:

基于两维语义的证据推理方式研究

假设权重向量为:

基于两维语义的证据推理方式研究 

知足:

基于两维语义的证据推理方式研究

则可应用证据推理算子将多个两维语义信息举行集成。

综合 p 个两维语义评价信息后,其集成效果仍为证据体,可以示意为:

基于两维语义的证据推理方式研究

0x5:算例剖析

假设预先设定的针对评价工具的语言评价集 H = {H1,H2,H3,H4} = {差,中,良,优},专家对评价工具的熟悉水平的语言评价集为 S = {S1,S2,S3} = {熟悉,较熟悉,部门熟悉}。

现有五位专家 Ei(i=1,2,3,4,5),针对某一个评价工具给出的两维语义评价信息为:

  • E1 = (H1,S2)
  • E2 = (H2,S2)
  • E3 = (H2,S3)
  • E4 = (H3,S1)
  • E5 = (H2,S2)

假设专家接纳两维语义的点信度示意,且给出点信度语义示意如下表所示:

基于两维语义的证据推理方式研究 

凭据上表中两维语义的点信度示意,5位专家给出的两维语义评价信息的点信度可划分示意为:

基于两维语义的证据推理方式研究 

设5位专家的权重向量为(凭据专家对专家的领会这一领域知识得出):

基于两维语义的证据推理方式研究

则由证据推理算子,将5位专家给出两维语义信息举行集结为:

基于两维语义的证据推理方式研究

即综合5位专家的意见,以为该评价工具为”优“、”良“、”中“、”差“的可信度划分为:19.85%、35.21%、27.54%、1.26%、另有另外16.14%的信度不知道被评为哪个品级。 

Relevant Link:  

《证据推理理论方式及其在决议评估中的应用》   

 

5. 基于两维语义的群体决议方式

0x1:基于两维语义的专家组合赋权法

影响专家评价准确性的因素主要有两个方面,

  • 一方面是专家对决议工具的熟悉水平(或领会水平),可通过专家对自己做出的评价举行自评价,其体现的是专家对所做评价信息可靠性的自我评估(简称自评)
  • 另一方面是专家的宽严尺度(评价尺度),其体现了专家评价的主观偏好,需要与其他专家对照举行评估(简称他评)

一样平常来说,专家对决议工具熟悉水平越高,评价的准确性就越高;对统一个决议工具的评价与其他专家评价的差异性越小,该专家对评价尺度掌握的情形的情形可能就相对越好。

1、自评尺度

2、他评尺度

与其他专家评价的差异性,可以通过对统一个决议工具各专家评价信息的距离或相似度来器量。

假设第一维度(对决议工具的评价)的评语集为 H1,H2,…..,HN,划分赋值为 h1,h2,….,hN,知足当 i ≥ j 时,hi ≥ hj,则评价信息 Hi 和 Hj 的距离可界说为:

基于两维语义的证据推理方式研究

显然,di,j 知足距离的基本性子:

  • 0 ≤ di,j ≤ 1
  • 当且仅当 hi = hj 时,di,j = 0
  • di,j = dj,i
  • di,j ≤ di,k + dk,j

假设有 p 个专家对某一决议工具举行评价,则可以盘算出专家们提供评价信息之间的两两距离,可用一个距离矩阵示意:

基于两维语义的证据推理方式研究

界说评价信息 Hi 和 Hj 之间的相似性测度 Sim(Hi,Hj) 为:

基于两维语义的证据推理方式研究

其效果可以用一个相似矩阵示意:

基于两维语义的证据推理方式研究

两个评价信息距离越小,它们的相似性水平就越大,该评价系统中对评价信息 Hi 的支持度 Sup(Hi) 为:

基于两维语义的证据推理方式研究

从公式中可以看出,支持度体现了某个专家的评价信息 Hi 在偕行中的累计相似水平,通俗地说就是群体共识。

将支持度归一化后可得评价信息 Hi 的可信度 Crdi: 

基于两维语义的证据推理方式研究 

可将 Crdi 作为专家 Ei 提供评价信息的一个权重 ui,即权重 ui 为:

基于两维语义的证据推理方式研究

另外,第二维度的评价值 St 是对第一维评价信息质量的评价,可将第二维度的评价值 St 举行量化。假设专家 Ei 给出的第二维度的评语的量化值为 qt,则可赋予该专家评价信息的另一个权重 vi 为:

基于两维语义的证据推理方式研究

为了周全反映专家评价信息的重要性,此处行使专家给出的两维语义评价信息,凭据每个维度的评价信息划分对专家举行赋权,再接纳乘法合成法对专家评价信息举行组合赋权,专家评价信息的最终权重 wi 为:

基于两维语义的证据推理方式研究

笔者提醒

这和之前讨论的基于证据同盟的证据融合方式,其原理是类似的。

0x2:决议步骤

假设有 M 个备选方案 aj(j=1,2,…,M),专家 Ei 对方案 aj 给出的两维语义评价信息为:

基于两维语义的证据推理方式研究

针对多个专家给出的两维语义评价信息,可以凭据以下步骤举行决议:

  • 步骤1,确定专家的权重。假设专家 i 给出的两维语义评价信息 Ei = (Hki,Sti),对专家举行组合赋权,可得专家的权重 wi(i=1,2,…,p)
  • 步骤2,给出两维语义信息的点信度或区间信度语义示意,在不完全信息规则和信息单峰规则的前提下,由多个专家经由频频斟酌(或者由数据驱动),给出两维语义信息的点信度或区间信度语义示意,将两维语义信息示意为证据体。
  • 步骤3,综合多个专家的两维语义信息,将转化为多个专家的两维语义信息举行集结,可得每个方案的综合评价效果,其效果仍示意为一个证据体。
  • 步骤4,对多个决议方案举行排序择优,应用两维语义对照方式,将多个方案举行排序择优。

 

原创文章,作者:admin,如若转载,请注明出处:https://www.2lxm.com/archives/6507.html