文化自信的特征汇总十篇

时间:2023-07-09 09:01:13

文化自信的特征

文化自信的特征篇(1)

【中图分类号】G434 【文献标识码】A 【论文编号】1009―8097 (2008) 12―0094―03

引言

英语教学资源是指蕴涵了特定的教育信息,可以提供给英语学习者使用,能帮助和促进学生学习的各类英语信息资源,特别是能以数字信号在互联网上进行传输的英语教学资源。数字化和教育价值是它的核心特征。网络多媒体技术与外语教学的有机整合极大地丰富了外语教学的信息资源。特别是,Internet的出现,使得大量的真实而鲜活的语料资源实现了电子化和网络化,变“供给制”为“自助餐式”,为学习者提供了自主选择语料的广阔天地。为主动式学习创造了有利条件。电子载体语料源不仅从数量上达到了“应有尽有”的丰富程度,而且从质量上实现了教学内容的“零时差”,从根本上改变了外语资源单一匮乏和陈旧老化的局面[1]。

按照教育部现代远程教学资源建设委员会于2000年5月所推出的《现代远程教学资源建设技术规范》的规定[2],从教学资源建设的实际出发,把教学资源分为以下几类:媒体素材、题库、试卷素材、课件、案例、文献资料、常见问题解答、资源目录索引和网络课程。

目前的英语教学资源库系统主要提供教学资源上传、教学资源查询和教学资源下载等功能。主要就是以“物”为主,未能体现“以人为本”的思想,特别是现有的教学资源库不具备个性化和智能化等特性,从而普遍存在海量教学资源与用户个性化需求之间的矛盾[3]。由于这个矛盾的存在,一方面造成了教学资源的巨大浪费,另一方面,为用户查找和使用所需要的教学资源造成了巨大的困难。这些问题都阻碍了英语教学资源在教学中作用的发挥,造成了极大的教学资源浪费。

向用户提供个性化教学资源服务能很好的解决这个矛盾。个性化教学资源服务是根据用户(这里指学习者)的使用行为和特点,来向用户提供满足其个性化教学资源需求的一种服务。由于学习者的学习起点、学习风格、学习愿望、学习步调等方面存在个体差异,在进行资源库建设时要考虑资源库建设的多层次、多元化、开放性和动态更新及时性,让不同的学习者能在资源库中取得各自所需要的资源。

本文针对目前教学资源服务中普遍存在的海量教学资源与用户个性化需求之间的矛盾,在校园网英语教学资源库系统中增加一个教学资源个性化检索模型(Individualized Search Model of Teaching Resource,以下简称ISMTR),该模块把基于网络的个性化信息服务引入英语教学资源体系,尊重用户中存在的差异,学习和跟踪用户的个性化兴趣,并根据用户的个性化兴趣特征对教学资源进行过滤,实现少而精的教学资源个性化检索。

一 关键技术

1 教学资源的描述

由于教学资源中,决大多数是多媒体信息,它们很难从其内容中提取特征。教育部现代远程教学资源建设委员在《现代远程教学资源建设技术规范》中指出,为了便于检索和共享,需要对教学资源进行属性标注。在这些属性中,很重要的一项为关键词属性。本文所设计的系统采用关键词属性作为教学资源特征。为了描述关键词某个关键词所代表的知识点占该教学资源总体内容的比重,我们在关键词结构类型中增加一个“比重”字段,类型为数值型。当然,也可以不增加这一字段,系统默认每个关键词在该教学资源的比重相同,即每个关键词的比重都为1/n,n为该教学资源的关键词数量,一般为5~10个[4]。

2 用户兴趣的描述与获取

(1) 用户兴趣的描述

用户兴趣即用户的个性化特征,它是指由人类个体特性所决定的其对英语教学资源的需求的特征信息的组合,也就是由特定用户对英语教学资源需求的决定关系而产生的一系列对个体有用的信息。

在教学资源采用了以关键词为特征后,用户对某一教学资源的兴趣就可以用他对该教学资源的这些关键词的兴趣。若用户对某个教学资源有较大兴趣就会花精力去获取这些教学资源。由于Web用户对教学资源的获取的基本途径是浏览,因此用户的既往浏览教学资源中的包含该用户的个性化特征,用户对教学资源的访问的次数越多、最近访问时间越近,用户对该教学资源的兴趣度越高。即兴趣强度应包含访问次数和最近访问日期这两个实际兴趣指标。

(2)用户兴趣的获取

获得反映用户信息的个性化信息有这样两种方法:第一种方法是由系统记录用户的访问特征形成日志文件,然后通过分析该日志文件或由浏览器产生的日志文件总结出用户兴趣模型。第二种方法由用户通过填写表单来提供自己的个性化特征信息。这种方式的优点是用户兴趣模型的收敛快,并且能比较准确地反映用户的需要和兴趣。需要用户事先总结自己的信息需求。由于语言表达的问题和分类的模糊性与多样性,用户往往不能通过这种方法将信息需求表达清楚。另外,因为它要求用户主动填写,所以系统不能主动跟踪用户的兴趣变化。

在本文所设计的系统中,对于新注册用户,我们采用第二种方法来收集他们的初始个性化特征,对于已注册用户,我们采用第一种方法来及时跟踪他们的个性化特征。

3 向量空间模型

向量空间模型是由Salton提出的关于文档表示的模型。它以特征项作为文档表示的基本单位,特征项可以由字、词或短语组成。所有的特征项构成特征项集。每个文档可以表示为一个向量,向量的维数是特征项集的个数,向量的每个分量是特征项在文档中出现的次数[5]。表达文档和用户兴趣比较直接的做法是利用文档特征。用户兴趣是多方面的,可以直接利用从浏览过的文档中抽取的词来表达用户兴趣。该方法不局限于预定义好的主题词表,矢量的维数一般是不固定的,当然也可以指定一个固定的大小。

采用向量空间模型表示文档的特征后,用户的兴趣就可以看成是一个文档,也就可以表示为一个向量U。文档与用户兴趣的相似程度就可以用文档向量V与用户兴趣向量U的余弦相似度sim(V,U)来表示。

4 信息过滤技术

目前人们习惯使用搜索引擎在广阔的互联网上获取所需信息。但是当人们输入一个关键词后,会有成百上千条乃至更多的信息被提供给用户,然而可能其中仅有一小部分信息满足用户的个性需求,甚至没有。这就是所谓的信息庞大而知识匮乏。这就需要根据用户的个性兴趣进行信息过滤,把所得到的不相关信息减至最小。

信息过滤技术(Information Filtering)正是为解决这一问题而提出的[6]。它是用来描述寻找符合人们兴趣的信息处理过程,也就是从大量的动态信息中找出最忠实地满足用户所需信息的过程。它使用用户模型(User Model)来描述用户兴趣主题,将新来的信息或者用户检索到的信息与用户模型进行相关度计算,然后对信息按相关度进行排序,过滤掉不相关的或者相关度小于某一个阈值的信息。通过信息滤波,与用户个性不相关的信息即用户不感兴趣信息被过滤掉了,反馈的结果都是用户感兴趣的信息,并按相关度大小排序。

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

二 模块设计

ISMTR模型的主要功能是在网络英语教学资源库系统中学习和跟踪用户的个性化兴趣,并根据用户的个性化兴趣特征对教学资源进行过滤,帮助用户在海量的网络英语教学资源库系统中快速而准确检索他所感兴趣的教学资源。ISMTR模型的结构如图1所示:

(1)特征提取模块实现根据用户对英语教学资源浏览和相关反馈,来提取用户感兴趣的教学资源的特征信息,然后把这些特征信息保存在用户个性特征库中并及时跟踪和更新。当用户在对教学资源进行浏览、下载和检索操作时,特征提取模块提取用户个性化访问的特征信息,包括教学资源的关键词、访问日期和累计访问次数,并把这些信息保存在用户个性特征库中。

(2)用户个性特征库用于记录用户的个性化信息。它动态跟踪用户的兴趣,提取并记录关键词作为用户个性特征,并为用户模型构建模块提供用户特征;

(3)用户模型构建模块完成从用户个性特征库提取关键词来构成个体用户模型;

(4)个性化教学资源过滤模块是该ISMTR模型最重要的一个模块,它可以根据用户模型实现对英语教学资源的过滤;在我们的系统中,我们使用用户兴趣向量U来作为用户模型(User Model),以此来描述用户兴趣主题;同时我们提取教学资源的关键词来形成特征向量R。将用户检索到的教学资源的文档特征向量R与用户兴趣向量U进行余弦相关度计算,余弦值越大表明它们的相关度Sim(U,R)也就越大,反之则越小。计算公式如下:

(5)个性化检索模块是接受用户的检索请求,由过滤功能模块根据用户模型对英语教学资源进行过滤,形成个性化检索结果。用户把自己的查询需求表达成由关键词组成的检索词或检索表达式,通过用户界面输入到系统;系统接收到用户的检索词或检索表达式后,由资源库管理模块依据查询字段的匹配,从英语教学资源库中查找出所有满足条件的教学资源,形成第一次检索结果;然后,由过滤功能模块根据用户模型对英语教学资源库中符合第一次检索结果的教学资源进行过滤,得到按相关度排序的所有与用户模型相关的教学资源,形成个性化检索结果提交给用户。

(6)英语教学资源库保存英语教学资源的详细信息,包括资源编号、资源名称、适用对象、内容简介、关键词、文件大小、存储位置等。在这些属性中,很重要的一项为关键词属性,它是教学资源的特征属性。

(7)ISMTR模型的工作过程:首先由特征提取模块来提取用户感兴趣的英语教学资源的特征信息,并把这些特征信息保存在用户个性特征库中并及时跟踪和更新,其次由用户模型构建模块根据用户的个性化特征信息构成用户模型,然后由个性化教学资源过滤模块根据用户模型实现对教学资源的过滤,最后由个性化检索模块根据过滤结果实现个性化检索。

三 实验及实验结果分析

为了得到实验对比效果,我们把ISMTR系统进行简化,去除与个性化服务相关的特征提取模块、用户模型生成模块以及个性化教学资源过滤模块,形成一个不具备个性化服务的对照实验系统作为对比。用户在对照实验系统中进行英语教学资源检索时,把自己的查询需求表达成由关键词组成的检索词或检索表达式,通过用户界面输入到系统;系统接收到用户的检索词或检索表达式后,由传统的数据库管理系统依据查询字段的匹配,从教学资源库中查找出所有满足条件的教学资源,形成检索结果。

信息过滤的主要技术包括三个方面:一是用户模型和教学资源的表示技术,二是匹配技术,三是相关反馈的利用技术。系统中用户模板和文档的表示均采用向量空间模型,匹配技术采用计算向量空间距离的方法,相关反馈为用户对于给出的教学资源做出明确的二元判断,即“满意”或者“不满意”,其结果用来改进特征项的比重,进而影响相似度。

目前对信息检索的代表性的评估标准为:查准率(Precision)和查全率(Recall)。

这两个指标是目前信息服务系统最常用的指标,它们定义如下[7]:

查准率=(过滤结果中符合用户兴趣的信息条数)/(过滤结果得到得信息条数);

查全率=(过滤结果中符合用户兴趣的信息条数)/(信息源中符合用户兴趣的全部信息条数)。

ITRDS系统注册的用户总数为40人,建立40个用户个性特征库,兴趣小组的人数为21人,教学资源库规模为67个,取相似度最大的前10篇教学资源提供给相应的用户。

通过实验,ITRDS实验系统平均查准率为0.2平均查全率为0.13;而对照实验系统平均查准率为0.16平均查全率为0.09。

通过实验,我们发现ITRDS系统的平均过滤精度要略大于对照实验系统的平均过滤精度,主要原因在于前者是根据用户的个性化特征进行教学资源过滤,其结果更具有针对性。由此可得,我们设计的具有用户个性特征学习功能和过滤功能ISMTR模型能有效地提高英语教学资源服务中个性化检索的查全率和查准率。

然而,本文所设计的ISMTR模型主要针对的是海量数据库,对于小规模的数据库,它的优势不明显。此外,用户个性化特征有着一定的滞后性,需要经过多次学习后才能收敛。

四 结束语

在英语教学资源的应用中,每个学习者有各自不同的背景、语言、文化、兴趣爱好,他们的学习起点、学习风格、学习愿望、学习步调等方面存在个体差异,有各自不同的学习路径和学习方法。建设适应用户个性化学习需要的教学资源个性化检索模型将有助于英语教学资源库的有效运用,同时为用户选择更需要的教学资源,满足各种用户不同的个性化需求,使每个学习者能够在特长领域中得到充分发展。

参考文献

[1] 沈彩芬.网络多媒体环境下的外语教学特征及其原则[J]. 外语电化教学,2008,121(5): 23-27.

[2] 教育部.现代教育技术规范[M], 北京:清华大学出版社,2001:21-23.

[3] 李宝敏.从知识管理的角度看远程教育中个性化资源库的建设[J]. 中国远程教育,2003,192(3):28-30.

[4] 寇兴权, 刘兴环. 远程教育资源的描述、组织和管理系统设计[J]. 控制工程,20029,(4):35-37.

[5] Yan T W, at al. Index structure for information filtering under the vector space model[R]. Technical Report STAN CS 93. Stanford University. 1993.

文化自信的特征篇(2)

中图分类号:TP301文献标识码:A 文章编号:1009-3044(2009)13-3489-02

1 引言

如何有效地组织和管理这些信息,并快速、准确、全面地从中找到用户所需要的信息是当前信息科学和技术领域面临的一大挑战。文本分类(Textcate gorization)是指在给定分类体系下,根据文本的内容将其分到相应的预定义的类别的过程,是文本挖掘的一种重要的组成部分,对提高文本检索的速度和准确率作用显著。

文本分类大致可分为三个步骤:文本的向量模型表示,文本特征选择和分类器训练。为了兼顾运算时间和分类精度两个方面,我们不得不进行特征选择,力求在不损伤分类性能的同时达到降维的目的利用文本分类技术可以把数量巨大但缺乏结构的文本数据组织成规范的文本数据,帮助人们提高信息检索的效率

2 文本的向量模型表示

目前常用的向量模型表示方法是向量空间模型(Vector Space Model,VSM)是上个世纪 Salton 提出的检索系统的向量模型。向量空间模型将文档映射为一个特征向量V(d)=(t1, ω1(d);∧;tn, ωn(d)),其中ti(i=1,2,…,n)为一列互不相同的词条项,ωi(d)为ti在d中的权值,一般被定义为ti在d中出现频率tfi(d)的函数,即ω2(d)=ψ(tfi(d))。在该模型中,文本空间被视为一组正交词条向量所张成的向量空间。向量的维数往往是惊人的,包含噪声且特征不明显。

3 文本的特征选择

特征选择是对原始特征空间采取的降维措施即从一组候选特征中选出一些最有效的、对文本分类贡献最大的特征组成一个最优特征子集。从优化角度来看,特征选择的过程实际上是一个特征优化组合的过程。文本特征选择的目标是用少量的特征达到相同或更好的分类效果,因此,对于相同表达能力的个体,其特征数目越少越好。目前特征选择使用的统计统计方法主要有基于频数的特征频度、文本频度方法以及基于信息论的互信息、信息增益、期望交叉熵、χ2统计、相关系数、文本证据权等方法。下面就分别介绍最常用的4种方法:

3.1 文档频率(DF, Document Frequency)

文档频率可表示为

■(1)

它是最简单的评价函数,计算量小是它最大的特点。DF评价函数的理论假设是出现频率小的特征所含信息小,但这一假设显然是不全面的。因此,在实际运用中一般并不直接使用DF,而是把它作为评判它评估函数的一个标准。

3.2 信息增益(IG,Information Gain)

IG是一种在机器学习领域应用较为广泛的特征选择方法。它从信息论角度出发,以各特征取值情况来划分学习样本空间,根据所获信息增益的多少来筛选有效的特征。IG可以用下式表示:

■ (2)

式中,P(Ci|t)表示文本中出现特征t时,文本属于Ci的概率;P(Ci|t)表示文本中不出现单词t时,文本属于IG的概率;P(Ci)表示类别出现的概率;P(t)表示t在整个文本训练集中出现的概率。

3.3 互信息(MI, Mutual Information)

MI是信息论中的概念,用于度量一个消息中两个信号之间的相互依赖程度.在特征选择领域中,特征t和类别Ci的互信息体现了特征与类别的相关程度。在某个类别Ci中出现的概率高,而在其它类别中出现的概率低的特征t将获得较高的互信息。MI可表示为

■ (3)

3.4 χ2 统计量CHI(χ2 Statistic)

■(4)

式中,A是特征t和第A类文档共同出现的频度;B是特征t出现而第A类文档不出现的频度;C是第类文档出现而特征t不出现的频度;D是第A类文档和特征t都不出现的频度;N为总共的文本数。

χ2方法认为特征t与文本类别Ci之间的非独立关系类似于具有一维自由度的χ2分布。它基于如下假设:在指定类别Ci的文本中出现频率高的词语和在其他类的文本中出现频率高的词语,对判断文章是否属于类别Ci都有帮助。

4种特征选择方法的基本思想是对每一个特征即词条,计算它的某种统计的度量值,然后设定一个阈值T,把度量值小于T的那些特征过滤掉,剩下的即认为是有效特征。表1是4种特征选择方法的各自优缺点。

从表1可以看出,4种传统的特征选择方法都有自身的缺点,为了克服它们各自的缺点,本文提出在它们的基础上再利用遗传算法对其进行特征的选择。

4 遗传算法与传统文本特征选择方法相结合的算法

遗传算法模仿生物进化过程的自然选择和进化机制,是一种基于群体的全局随机优化算法。遗传算法对要求解的问题(参数)进行编码,在解空间产生初始解群体,通过遗传变异逐步向全局最优解进化。遗传算法作为比较成熟的算法,很多文献都有论述,这里不作详细介绍,可参阅文献[1,2,3]。本文所做的实验思想是:先利用传统的文本特征选择方法(DF、IG、MI、CHI)对文本特征进行选择,再用遗传算法进行筛选,最终选出符合文本分类的特征项。

4.1 遗传算法与传统文本特征选择法相结合的算法

输入:经过分词处理的词条集。

输出:文本特征集。

算法描述:

[T1].利用中科院的分词系统对文本进行分词,得一词条集T;

[T2].利用各公式对T进行传统文本特征选择方法的各公式计算,结果为T1;

[T3].T1的词条作为遗传算法的编码:出现的词条为1,未出现的词条为0,得一{0,1}的集合;

[T4].再利用TF-IDF公式进行权重计算:

■(5)

其中N为所有文档的数目,ni为含有词条ti的文档数目,tfi表示词条T在文档Di中的出现频数。

[T5] .适应度函数[4]

■ (6)

其中N为所有文档的数目,ni为含有词条ti的文档数目,tfi表示词条T在文档Di中的出现频数。

■ (7)

Wik、Wjk为向量Ti,Tj中的元素。

[T6].本文采用赌选择法,其基本思想是:各个个体被选中的概率与其适应度大小成正比。

■(8)

[T7] .交叉算子

本文采用一种新的交叉策略――插入交叉,其具体算法过程如下:

1) 随机选取父本,确定插入点和基因片段;

2) 插入基因片段;

3) 删除重复基因。

[T8] .变异算子

在本算法中先随机选取一个染色体,根据词条权重,由赌方式获取某个基因(即特征词),删除此基因,并在词汇表中随机选取一个染色体中没有的基因,放入该位置,从而形成一个新的原始后代。

5 实验结果与结束语

通过初步的实验,发现用特征选择法与遗传算法相结合的方法,在查全率与查准率上比单纯使用特征选择法或使用遗传算法进行特征的筛选上有明显的提高。但在时间上,使用的结合法所花时间就比较长,这是需改进的地方。

在四种选择法与遗传算法相结合中,IG+GA的效果是最好的,其次是CHI+GA,MI+GA的效果是最不佳的;DF+GA运行速度是最快的。

参考文献:

[1] 边肇祺,张学工.模式识别[M].北京:清华大学出版社,2000.

文化自信的特征篇(3)

引言

支持向量机是一种在统计学习理论的基础上发展而来的机器学习方法,通过学习类别之间分界面附近的精确信息,可以自动寻找那些对分类有较好区分能力的支持向量,由此构造出的分类器可以使类与类之间的间隔最大化,因而有较好的泛化性能和较高的分类准确率。由于支持向量机具有小样本、非线性、高维数、避免局部最小点以及过学习现象等优点,所以被广泛运用于故障诊断、图像识别、回归预测等领域。但是如果缺少了对样本进行有效地特征选择,支持向量机在分类时往往会出现训练时间过长以及较低的分类准确率,这恰恰是由于支持向量机无法利用混乱的样本分类信息而引起的,因此特征选择是分类问题中的一个重要环节。特征选择的任务是从原始的特征集合中去除对分类无用的冗余特征以及那些具有相似分类信息的重复特征,因而可以有效降低特征维数,缩短训练时间,提高分类准确率。

目前特征选择的方法主要有主成分分析法、最大熵原理、粗糙集理论等。然而由于这些方法主要依据繁复的数学理论,在计算过程中可能存在求导和函数连续性等客观限定条件,在必要时还需要设定用来指导寻优搜索方向的搜索规则。遗传算法作为一种鲁棒性极强的智能识别方法,直接对寻优对象进行操作,不存在特定数学条件的限定,具有极好的全局寻优能力和并行性;而由于遗传算法采用概率化的寻优方法,所以在自动搜索的过程中可以自主获取与寻优有关的线索,并在加以学习之后可以自适应地调整搜索方向,不需要确定搜索的规则。因此遗传算法被广泛应用在知识发现、组合优化、机器学习、信号处理、自适应控制和人工生命等领域。

基于改进遗传算法的特征选择

遗传算法是一种新近发展起来的搜索最优化算法。遗传算法从任意一个的初始生物种群开始,通过随机的选择、交叉和变异操作,产生一群拥有更适应自然界的新个体的新一代种群,使得种群的进化趋势向着最,优的方向发展。图1中所示的是标准的遗传算法的流程框图。

传统的遗传算法存在早熟收敛、非全局收敛以及后期收敛速度慢的缺点,为此本文提出了一种能够在进化过程中自适应调节变异率,以及利用模拟退火防止早熟的改进遗传算法,同时该算法利用敏感度信息可以有效地控制遗传操作。图2是改进遗传算法的流程框图。

染色体编码和适应度函数

所谓编码是指将问题的解空间转换成遗传算法所能处理的搜索空间。在特征选择问题中,常常使用二进制的编码形式,使得每个二进制就是一个染色体,其位数长度等于特征的个数。每一位代表一个特征,每位上的1表示选中该特征,0则表示不选中。每一代种群都由若干个染色体组成。

适应度函数是整个遗传算法中极为重要的部分,好的适应度函数能使染色体进化到最优个体,它决定了在整个寻优过程中是否能够合理地协调好过早收敛和过慢结束这对矛盾。由于本文针对的是支持向量机的特征选择问题,所以考虑以分类正确率和未选择的特征个数这两个参数作为函数的自变量。将分类正确率作为主要衡量标准,未选择的特征个数为次要标准。由此建立以下的适应度函数:式中c为分类正确率。为未选择的特征个数,a是调节系数,用来平衡分类正确率和未选择的特征个数对适应度函数的影响程度,同时该系数也体现了用最少的特征得到较大分类正确率的原则,在本文中a取0.00077。由上式可知,分类正确率越高,未选的特征个数越多,染色体的适应度就越大。

选择操作

选择操作需要按照一定的规则从原有的种群中选择部分优秀个体用来交叉和变异。选择原则建立在对个体适应度进行评价的基础上,目的是避免基因损失,提高全局收敛性和计算效率。本文首先将整个种群中最优的前40%的个体保留下来,以确保有足够的优良个体进入下一代,对剩下的60%的个体采用算法进行选择,这样做可以弥补保留前40%个体而带来的局部最优解不易被淘汰的不利影响,有利于保持种群的多样性。

基于敏感度信息量的交叉、变异操作

独立敏感度信息量Q(i)指的是对在所有特征都被选中时计算所得到的适应度值Allfitness以及只有特征i未被选中时计算得到的适应度值Wfitness(i)按式(2)进行计算得到的数值。独立敏感度信息量刻画了适应度对特征是否被选择的敏感程度。

互敏感度信息量R(i,j)由(3)式可得,互敏感度信息量体现了特征与特征之间对适应度的近似影响程度。

交叉操作的作用是通过交换两个染色体之间的若干位从而生成含有部分原始优良基因的新个体。由式(3)可知互敏感度信息量可作为不同特征之间含有相似分类信息的一种度量,所以可以将互敏感度信息量代入式(4)计算出染色体在第一位发生交叉的几率β(j),在式(4)中i和j分别代表特征和特征j,是染色体的长度。β(i)是特征,相对于其他所有特征在互敏感度信息量上的归一量,反映了特征与其余特征在相似信息量上的总和。由此对应到染色体上,β(i)就可以认为是染色体的第i位与整个染色体在基因信息上的相关性,β(i)越小则说明相关性越大,第i位与整个染色体所含的基因信息越接近,此位为分裂点的几率越小。由于β(i)是归一化量,故可采用算法来选择一个交叉点。

变异操作是引入新物种的重要手段,可以有效地增加种群个体的多样性。本文中的变异率Pm采用相邻两代之间的最优适应度增幅比作为自变量进行自适应调节,如式(5)所示。当适应度增幅比正向增大时,较小的增幅比可以使变异率维持在中等水平,并且变异率随着增幅比的增大而缓慢降低,这样既能够拥有一定数量的新个体也可以抑制过多不良染色体的产生,保证优秀染色体的进化足够稳定;而当适应度增幅比反向增大时,由较小增幅比则可以获得较高的变异率。并且变异率也伴随增幅比同比缓慢升高,确保有足够的染色体发生变异,稳定地加快进化速度。 式中dis指新生种群的最优适应度相对于原种群的最优适应度的增幅比,尚k均是区间(0,1)上的调节系数。文中的j与k分别取0.65和0.055。

独立敏感度信息量在一定程度上体现了单个特征所含有的分类信息量,如果独立敏感度信息量小,则说 明该特征所含信息大部分对分类没有帮助,即该基因位发生突变后对整个染色体的优异性影响不大,突变的概率也就相应减小。因此将独立敏感度信息量归一化后所得到的q(i)作为特征i被选为变异点的概率。变异点的具体选择方法为:针对一个染色体按照染色体的位数进行循环遍历,在该循环中由变异率Pm判定是否产生变异位。若需要产生变异位,则依据q(i)按照算法进行选择。

模拟退火选群

在每一轮进化完成后都需要决定进入下一轮进化的种群。如果过多地将较优种群作为父代,就会使算法过早收敛或搜索缓慢。文献中指出模拟退火算法能够以一定的概率接受劣解从而跳出局部极值区域并最终趋于全局最优解。因此可以将上文提到的最优适应度增幅比作为能量函数,运用模拟退火的Meteopolis准则来选择待进化的种群。为了使每个种群得到充分地进化,预防最优解的丢失,这里采用设置退火步长的策略来实现模拟退火选群。该策略具体为:使退火步长对同一种群作为父代的次数进行计数,一旦产生更优种群则退火步长就置零并重新计数。若退火步长累计超过一定的阈值时,就进入模拟退火选群阶段。退火步长累计到一定数量意味着原有种群的进化已经停滞,需要用模拟退火算法摆脱这种停滞状态。如果增幅比大于零,则说明新生种群优于原有种群。这时完全接受新种群进入下一轮进化:否则新生种群劣于原有种群,并以一定的概率p接受较劣的新生种群进入下一轮进化。接受概率lp由式(6)和式(7)共同决定,其中dis为增幅比,T(s)指温度参数,To和s分别是初始温度和迭代次数。

以上两式的参数要满足进化对接受概率的要求。即增幅比负增长越大,接受概率降低越迅速,但接受概率随迭代次数的增加应缓慢下降。这样做能够保证在有限的迭代次数内有一个适应度较优的新生种群进入下一轮进化,以达到减少计算量和优选待进化种群的目的。在本文中To=0.2,A=0.9,m=0.5。

实例的验证与分析

UCI数据库常用来比较各种方法的分类效果,因此可以用其验证本算法对支持向量机作用后的分类效果。文献㈨采用了UCI数据库中的German、Ionosphere和Sonar三种数据作为实验对象,为了便于与文献中所用的几种方法进行对比,本文也采用这三种数据进行实验,并按照文献中所述的比例将各类数据分成相应的训练样本和测试样本。

在种群规模为30,交叉率为0.8、起始变异率为0.1的条件下使用支持向量机作为分类器(惩罚参数为13.7,径向基核函数参数为10.6)对所选数据进行分类,表1中显示了本文算法与文献中几种算法在分类效果上的对比,表2给出了三种数据的最终选择结果。表1中共出现了四种方法:方法1:使用本文算法:方法2:使用NGA/PCA方法;方法3:使用PCA方法;方法4:使用简单遗传算法。

由于本文算法旨在用最少的特征个数最大化分类正确率,因此从表1中可以看出本文算法在特征选择个数和分类正确率上均比其他三种方法更具优势。由于NGA/PCA算法是针对简单遗传算法和主成分分析法的不足而做的改进,其性能优于简单遗传算法和主成分分析法,所以本文算法的分类效果优于NGA/PcA算法这一事实更能说明该算法可以较好地解决支持向基机的特征选择问题。

结语

通过与其他方法的比较,本文算法的分类效果得到了充分的验证,也说明了该算法具有极好的泛化能力以及在敏感度信息量地指导下遗传操作的有效性。

文化自信的特征篇(4)

个性化网页推荐系统,对现代电子商务的发展具有重要的实用价值和商业价值。将特征提取技术广泛的应用在个性化网页推荐系统中,对于操作系统应用网络系统和数据挖掘技术对客户进行商品推荐,实现了销售再次合作,有效的防止了客户的流响。

一、个性化网页推荐系统

近年来,随着网络在世界范围内的普及应用,民众对网页的浏览已在世界范围内风靡。个性化网页推荐改变了用户单一被动接受信息的模式,搜索引擎功能的运用实施也比以往的只有搜索与用户匹配的关键词完成上,占有更大优势。个性化网页推荐的应用,扩大了网页推荐引擎的搜索范围,能为用户提供更多他们感兴趣的网页。个性化网页中,关键词的概括更具概括性。

个性化网页推荐体系的服务器端,由特征提取对其负责文本进行分类预处理,通过对候选网页进行推荐和进一步筛选,最后再与客户端实现数据的交互传输。

二、特征提取技术

特征提取技术,即可以通过提取用户阅读的网页内容,挖掘出用户感兴趣的内容。在个性化网页推荐系统中的应用,通过关联规则筛选出了符合条件的搜索内容,避免了搜索过程中出现的无法搜索项。推荐网页链接由网页推荐系统对用户程序自动捕获阅读网页事件,并通过客户端在浏览器窗口右侧。以当前网页为中心,将兴趣分支供用户观赏。

特征提取技术应用在网页推荐系统中,能使Web通过网络用户注册数据的了解用户基本情况,偏好及浏览行为中累积的原始空间维数,对于用户潜在的兴趣爱好及未来商家的可实用性和可操作性进行综合评判。

由于网页推荐系统显示的终端数据五花八门,从原理上来说,就承载了太多数据的无效空间,利用“指纹”特征,能更有效,更有针对性的挖掘出有用的信息,而且节省了时间和用户就此付出的费用。网页推荐系统研究中,就将特征提取技术作为通信领域的划时代变革。

由于网页数据的无结构化特点,在对一些文本进行预处理时,原始空间特征你的系统维数,无论怎样来说都需要特征压缩文件对其维数进行压缩工作.网页的特征提取技术,在这一时段的应用中就发挥了不可超越的力量。

三、个性化网页推荐系统设计与应用

因为个性化网页推荐系统是多步骤系统性处理数据,对于提高其系统的实时性和处理空间维数的能效来说,可以费时较长的步骤利用系统服务器的闲置时间进行处理或将部分结果存储于数据库中。

特征提取技术在个性化网页推荐系统中的设计使用原理:商家经由Web处理和识别用户;通过特征提取技术,读取系统数据库数据并经由用户反过来信息以后,再次将数据库数据传输给用户;再次由系统自动组件,通过用户反馈回来的信息挖掘并推荐处理再次数据;对于数据结果,网页系统会对原始空间维数进行预处理,将部分耗时较长的数据自动在系统闲时处理,部分用于存入LOG中;个性化网页推荐系统就以存储读取数据,最后对网页做出推荐结果。中间的各个环节,都需要用户意见的及时反馈,最终处理的结果就是个性化网页推荐系统将高效正确的信息显示给用户。这样就完成了,特征提取技术在个性化网页推荐中的运用。

个性化网页推荐系统中,广泛应用特征提取技术,不但有利于降低空间系统维数,更有利于对用户所需要的信息进行价值凭升,对于原始空间中存在的无价值信息,特征提取会做出及时的反馈并根据自身评定,做出简单取舍。

特征提取技术的进步,能有效提升计算量,在中文标识记的文本特性中,提取的精确度,直接程度上有利于个性网页推荐使用中,达到用户的满意度,提升他的内在营运价值,将网页浏览和获取信息量,真正成为商业用途中高效能的使用工具。

四、总结

特征提取技术在个性化网页推荐系统中的应用,对于网络交易平台的实现和节省用户使用网络的费用和时间,同时对于促进网络商务交流合作具有极大的创新意义。利用网页推荐技术助企业分析从网上获取有效数据,实现他们的动态科技创新发展,具有很大意味的企业调整营销策略。

参考文献

文化自信的特征篇(5)

中图分类号: 文献标识码:A文章编号:1007-9416(2010)01-0000-00

Speaker Identification on the base of

time-varying characteristics of speech signal

XU Liangjun,FEI Wanchun,ZHANG Weijie,LU Xingxing

(College of Textile and Clothing Engineering, Soochow University, Suzhou, 215006, China)

Abstract: Time-varying characteristic frequency was extracted from the average Mel cepstrum, and the cepstrum value series of characteristic frequency were gained. The deterministic and stochastic parts of the time series were separated by use of time series pretreatment and statistical methods. As zero mean autocovariance nonstationary time series, the stochastic parts were analyzed by the full order TVPAR(Time-Varying Parameter Autoregressive)model, and the characteristic parameters were extracted from speech signals of the speaker. Then the speech signals were recognized on the stochastic parts of the time series and analysis with the full order TVPAR model. The experimental results manifest that the recognition rate obtained by full order TVPAR model are higher than only on stochastic parts of the time series, with one or two characteristic frequencies, the average recognition rate reaches 99.68% and 100% respectively.

Key words: characteristic frequency; nonstationarity; TVPAR model; Mahalanobis distance; speaker recognition

引言

说话人识别的主要目的是从待识语音中寻找说话人信息并根据要求给以判定或分类。说话人确认和说话人辨认是说话人识别中的两大任务。判定待识语音是否是指定个体的语音称为说话人确认,判断出待识语音是语音模板中哪个说话人的语音称为说话人辨认。说话人识别的关键问题是,用语音信号的哪些特征描述说话人语音是最有效可靠的。近年来有许多这方面的研究,目前最常用的特征参数有基音周期、共振峰频率、谱相关特征、LPCC(线性预测倒谱系数)和MFCC(Mel频率倒谱系数)等等[1],其中MFCC是一种比较常用且性能较好的特征参数。这是由于MFCC反映了人耳对频率高低的非线性感觉,和传统的线性预测倒谱系数LPCC相比,其识别性能和抗噪性能有着明显的优势[2]。而谱相关特征分析中,短时倒谱里同频率谱线随时间的相关性特征按说话人不同区别较大,已经得到把同一频率Mel倒谱值序列作为时间序列进行分析,取3个特征频率,平均识别率为97.94%[3]。本文在Mel短时倒谱的基础上进行谱相关性分析,分析语音信号时变的特性,获得了识别效果更好的特征参数。

茧丝纤度序列中蕴含着有趣的统计数理问题[4-5],在研究茧丝纤度序列时,得出了分析非平稳时间序列的时变参数自回归模型(TVPAR模型)理论[6-7]。本文把语音信号序列看作非平稳的时间序列,分析其时变特性,在Mel短时倒谱序列上寻找到特征频率倒谱值序列,并结合统计学方法建立不同时间特征频率倒谱值与Mel倒谱平均值之间的线性回归方程,提取特征频率倒谱值序列的趋势量和波动量。根据波动量的大小进行说话人辨认,再对波动量用TVPAR模型进行分析,进行说话人识别,并进行对比分析。

1 自协方差非平稳时间序列

某随机过程经过若干次采样得到时间序列 , , ,其中 为取样序列数,在统计意义上充分大, 的大小与实际的时间序列值的偏差有关, 为一正整数。在时间点 的平均值可由下式得到:

,

其自协方差可以由下式得到:

,

其中 。如果 ,则通常有

,

这种序列被定义为自协方差非平稳时间序列[7]。如果 ,则这种序列为零均值自协方差非平稳时间序列。

2 语音信号的时变特性

语音信号是非平稳时间序列,它的重要特性是具有时变性,但是在10~30ms时间范围内可近似看作平稳的,可以将语音信号分帧来处理。本文研究的是与文本有关的说话人识别,样本语音是/wei/(喂)。语音信号采样时,选用采样频率为11025Hz。分帧处理时,选帧长为23.2ms,帧移为5.8ms。

经过采样和量化得到时域上的语音信号。在对语音信号分析和处理之前,需要对其进行预处理。语音信号的预处理一般包括预加重、分帧、加窗以及端点检测等。预加重的作用在于滤除低频干扰,便于频谱分析。在进行分帧处理时,窗函数选用汉宁窗,经过端点检测去除静音段,得到语音段信号。为了便于后面的谱相关特征分析,通过调整帧移,对同一说话人同一文本内容的若干个语音的分帧数进行归一化处理,使其统一成该说话人文本语音的平均分帧数。

对语音段信号每一帧进行倒谱分析之后,可以将倒谱的实际频率变换到Mel频率,得到Mel频率短时倒谱。说话人每个语音都有Mel短时倒谱,其中,, 表示该说话人语音在频率 上第 帧的倒谱值,对说话人若干个语音的Mel倒谱求平均,就得到平均的Mel短时倒谱。如图1所示为某说话人文本语音的平均Mel短时倒谱三维时序图。从图中可以看出语音信号同一个频率上的对数幅度随时间变化,Mel倒谱峰值对应频率也随时间变化,这些体现了语音信号典型的时变特性。

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

3 特征参数的提取

3.1 特征频率的提取

为了建立时间序列,已有的方法是用各帧同一频率的Mel倒谱值建立时间序列[3]。本研究从语音信号的时变特性着手,考虑Mel倒谱峰值对应频率随时间变化,找出Mel倒谱峰值对应频率为特征频率。如图2为某说话人平均Mel倒谱上标出的,4个随时间变化的特征频率对应的倒谱峰值序列。把特征频率对应的Mel倒谱值序列看成非平稳时间序列。

可以看出这4个倒谱峰值序列中,特征频率是随时间变化的,如图3所示。我们把它也看成是语音信号在短时Mel倒谱上的一个时变特性。

3.2 特征频率对应Mel倒谱值序列的选择

说话人每个语音的特征频率都有对应的Mel倒谱值序列,把每个语音相同特征频率的倒谱值放在一起,组成Mel倒谱值序列[8]。图2对应的特征频率Mel倒谱值序列如图4所示。

图4 特征频率Mel倒谱值序列

我们认为特征频率随时间变化越大,则频率特征表述越好。本文把变化最大的频率作为特征频率。某说话人若干个相同语音的特征频率Mel倒谱值序列构成的时间序列如图5所示,设为 ( ),其中 代表第 个语音第 帧特征频率Mel倒谱值:

图5 某说话人特征频率Mel倒谱值序列

3.3 特征频率Mel倒谱值序列的回归分析

对于均值和自协方差皆非平稳的时间序列,其序列的均值与某时间的值之间,存在较好的相关性[4]。通过实验分析得知,第 语音信号的Mel倒谱序列的均值与该语音某时间点某特征频率的倒谱值 之间存在良好的相关性。设某特征频率Mel倒谱值序列 每一列的特征频率倒谱值用列向量 表示,说话人 个语音Mel倒谱序列的均值用列向量表示为 ,可以建立趋势量 与 之间的线性回归方程 。用矩阵形式表示为 ,其中 , , 。应用最小二乘法可以得到线性回归方程的参数 和 的估计值,则波动量序列为 。如图6所示为图5中序列经过分离得到趋势量和波动量。计算波动量序列中各列向量的标准差为 ,将 、 与 作为特征参数保存。

图6 分离后图5所示序列的趋势分量和波动分量

如图7所示为图6所示序列的自协方差 三维图,其中 ,一般地,如果 ,则。从图中可以看出特征频率Mel倒谱值序列的自协方差随帧号 的变化而变化,这是语音信号最重要的时变特性之一。

3.4 自协方差非平稳时间序列的模型分析

TVPAR模型首先是为了分析有限长度自协方差非平稳时间序列而提出的[7],它有满阶、定阶、变阶之分,区别就在于模型系数的阶次[6]。特征频率Mel倒谱值序列的波动量是一个零均值的自协方差非平稳的时间序列,可以使用TVPAR模型进行分析。本文选用满阶TVPAR模型对波动量序列进一步分析,以便更好地提取特征参数。

满阶TVPAR模型如式(1)所示:

(1)

其中自回归系数 和误差项 的方差 都随时间点变化,误差项 是均值为零、方差有限的白噪声。将波动量序列 代入满阶TVPAR模型,利用最小二乘法,使误差项方差 最小的估计值,得到的自回归系数 和误差项方差 ,保存为特征参数 和 。

4 基于语音信号时变特性的识别方法及算法

本文提取特征频率随时间变化的Mel倒谱值序列,用Mel倒谱序列均值作为线性回归方程的自变量,分离出波动量序列,并采用满阶TVPAR模型对波动量序列进行分析,在波动量序列和满阶TVPAR模型分析的基础上分别进行说话人识别。

4.1 识别指标

本文采用马氏距离作为识别指标[9]

(2)

用于对波动量序列进行识别。

(3)

用于对波动量序列在满阶TVPAR模型分析之后得到的误差项序列进行识别。

4.2 波动量基础上的说话人辨认

由于不同说话人的平均帧数不同,所以特征频率Mel倒谱值序列的时间不同。设第 个人的帧数为 , , ,则该说话人的特征频率为 。 为分离后波动量序列,它的标准差为 ,每个说话人都有线性回归系数 、 和标准差 。不妨设第n个人的回归系数为 、 ,标准差为 。待识别语音分别代入以上所有的语音模板参数最后得到波动量序列 ,把它与 代入马氏距离公式算得 ,距离最小的语音模板所对应的被判别为该语音的说话人。识别流程的基本结构如图8所示。

图8 波动量上说话人识别流程

4.3 满阶TVPAR模型基础上的说话人辨认

每个说话人都有自回归系数 和误差项方差 ,用矩阵形式分别表示为 、 。

不妨设第 个人的模型系数和误差项方差分别为 和 , ,将待识别语音的波动分量序列 代对应模板语音的模型系数,求得误差项序列 。同样以马氏距离 作为识别指标,距离最小的判为该语音模板对应的说话人。如图9所示为满阶TVPAR模型基础上的识别流程。

图9 满阶TVPAR模型上的说话人识别流程

5 识别结果与分析

本实验自建简单语音库,采用Windows中的录音机录制语音,共6人,5男1女,每人语音数大于等于80,语音统一为/wei/(喂)。录音时要求说话人语气平和,语速均匀。

本文采用的方法为,一次录制 个语音/wei/(喂),轮流取出1个语音作为待识别语音,剩余的( )个语音用于建立语音模板和提取特征参数。语音模板的样本容量至少是79。不同语音模板样本数在一个特征频率上的识别率如表1所示。增加特征频率有助于提高识别率进一步得到了验证,表2为相同语音模板下的两个特征频率的识别率。设在只对波动量序列进行的识别为方法①,用满阶TVPAR模型对波动量分析后进行的识别为方法②。

表1 不同样本容量的语音一个特征频率下的识别率 (%)

实验方法8085 9095 100 平均

方法① 81.97 87.2584.8184.74 85.6784.89

方法② 99.801199.12 99.5099.68

表2 不同样本容量的语音两个特征频率下的识别率 (%)

实验方法80 85 90 95100 平均

方法① 97.1399.2299.44 98.7799.5098.81

方法②11111 1

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

实验结果表明基于语音信号时变特性在波动量上进行的识别,识别率较特征频率不随时间变化的识别率要高[3]。而用满阶TVPAR模型对波动量分析后的识别率又有较大提高。选用一个特征频率,在满阶TVPAR模型基础上的识别率已经接近100%,两个特征频率都达到100%。

我们也考察了说话人确认的拒识率问题。拒识率是指将同一说话人的语音认为是不同说话人的,而加以拒绝的出错率。由于同一语音到本人语音模型的距离一般小于到他人语音模型的距离,通过选择合适的阈值,可以得到比较正确的判断,但是,有极少数会出现拒识现象。本文语音模板采用6人,每人100语音,选择合适的阈值时,两个特征频率在满阶TVPAR模型基础上的拒识率为1.67%。通过增加特征频率,相信拒识率会进一步减小。所以应用时间序列分析的方法,利用满阶TVPAR模型对语音信号进行分析,为说话人的识别提供了新的思路,理论分析和实验结果表明,这种分析方法是可行的。

6 结语

本文基于语音信号的时变特性,在Mel倒谱上提取随时间变化的特征频率,把各特征频率对应的Mel倒谱值作为时间序列。用Mel倒谱的平均值作为回归方程的自变量,提取特征频率Mel倒谱值序列的趋势量和波动量,对波动量序列进行识别。把波动量序列当作一个零均值自协方差非平稳的时间序列,使用满阶TVPAR模型对波动量序列进一步分析,对得到的误差项再进行说话人识别。

用马氏距离作为识别指标进行识别,比较波动量序列和满阶TVPAR模型上的识别结果,两个特征频率上平均识别率分别为98.81%和100%。

如何在不影响识别效果的前提下,适当减少特征参数,缩短识别时间,有待于进一步研究。

参考文献

[1] 胡航. 语音信号处理[M].哈尔滨: 哈尔滨工业大学出版社,2000,178-180.

[2] SHAO Yang, LIU Bingzhe, LI Zongge. A speaker recognition system using MFCC features and weighted vector quantization [J]. Computer Engineering and Applications, 2002, 38(5): 127-128.

[3] 张伟杰,费万春.一种说话人识别的新方法[J].计算机应用,2009(3): 764-767.

[4] 费万春,白伦.茧丝纤度序列趋势分量的解析和仿真研究[J].丝绸,200461,(8):22-25.

[5] 费万春.描述茧丝纤度序列的理论模型[J].丝绸,2007(2):19-21.

[6] FEI Wanchun, BAI Lun. Auto-regressive models of non-stationary time series with finite length[J]. Tsinhua Science and Technology, 2005, 10(2): 162-168.

[7] FEI Wanchun, BAI Lun. Time-varying parameter autoregressive models for autocovariance nonstationary time series [J]. Science in China Series A: Mathematics, 2009, 39(1): 71-78.

文化自信的特征篇(6)

标志是一种象征艺术,是具有特殊意义的视觉传达符号,代表着特定的事物。标志的特点是将丰富的内容,以更简洁、更概括的方式在相对较小的空间里表现出来,同时使观者在较短的时间内理解其含义。

人类运用图形符号来传达信息比运用文字要早。简练独特的图形符号,能在瞬间给人留下深刻的印象。进入信息社会后,通过产业化进程和国际化影响,标志已被注入了企业理念和企业形象等视觉表现的内容,从国家到政府部分,从企业到个人,从商务活动到体育活动会,标志符号到处可见,成为人们生活中不可缺少的一部分。

标志以各种精炼的形象表现一定的含义,将组织机构或企业精神面貌、行业特征充分体现出来,传达明确信息。由于其特有的社会功用,标志具有识别性、时代性、简明性、个性化、艺术性、文化性、象征性等特征。

一、标志的特征

1.识别性

显著、易识别是标志最基本的特征。标志能给企业一个特别的身份证明,人们正是通过标志传达的信息来预定或购买商品。现代社会商品种类繁多,商品信息量大,消费者完全凭借商品的标志来寻找自己的品牌。在这里商标的识别商品的作用特别突出。为区别其他标志,显示标志自身的独特特征,设计者要在标志的题材、要素表现形式、视觉构成中选择具有独特明显视觉特征的图形符号作为标志。避免因标志相互雷同、混淆而产生错觉,从而影响标志的识别。

如索尼公司下属品牌电脑VAIO标志(图1)是一个很好的例子,VAIO标志有两个概念:

一是代表基本的模拟信号和数字信号,二是与自然同行。

这个标志代表了电脑模拟技术和数码技术的特点。V和A字母呈正弦波,是最基本的模拟信号。I和O字母就好像1和0,象征二进制代码中的数字信号。很显然,VAIO的名字和标志体现了索尼公司的一贯风格并且寓意丰富,那就是索尼产品致力改变生活方式的新理念。它也使人回想起象形文字,追忆起古时人类与自然和谐相处的情景。与其说VAIO标志只是结合了数码科技,代表了一个家用电脑产品的品牌,不如说设计师精心创造了能象征VAIO电脑功能和揭示其自然本质的标志。这个标志给人们带来一种无限永恒的感觉,而这种感觉恰能使产品在以后得到无穷发展。

图1 索尼公司下品牌电脑VAIO标志

很多标志在投入使用后为了使本身更加容易识别,会不断进行改造,如百事可乐公司在最初的标志设计中字体的颜色是红色的,与可口可乐非常接近(图2)。在经过几次标志改造中为了能很好地区别于竞争对手,使消费者容易识别本品牌,字体颜色由红色逐渐转变成蓝色为主色调,从颜色识别入手进行改造。

图2 百事可乐公司标志的变化

2.时代性

随着时代的发展,标志也处在不断的变化中。社会经济的飞速发展,商业竞争的日益激烈,传播媒体制作技术的不断提高,应用领域推广的需要和流行时尚的变化都推动了标志为体现时代精神而不断进行调整、修改,变更自身形象,而采用清新、简洁、单纯、醒目的新形象。

如“壳牌石油”(图3),“百事可乐”的标志演变都是成功的例子。现代标志在不断完善发展的过程中体现出以下几个特征:保留原来标志部分的题材、形式,提炼精华,加强造型符号的视觉传达效果,并保证标志的信赖感不受损害;标志图形简洁,明确,易识别;采用构成的表现形式,改变旧的写实复杂的具象图形;为适应国际商业发展的需要,标志的字母形式有增加的趋势。

图3 壳牌公司标志的演变

3.简明性

标志应以简洁、生动、鲜明的形象传达信息,只有用最简洁明了的形象,人们才能在很短的时间内识别标志形象,利于记忆。在各种形形的标志中,我们可以看到其中大多数品牌设计手法简洁明了,如此高比例的相同的设计方法说明了标志设计的趋势――简洁明了。

如图4,耐克公司的标志由圆滑流畅的弧线组成,可谓简洁到了无以复加的程度。

4.个性化

一个标志如果失去了个性就无法建立起以标志为核心的识别差异,个性化是标志可识别性的一个重要特征。只有具备了强烈的个性化特征,才能使标志从众多的同类者中脱颖而出,并给人以深刻印象。标志的个性化主要是通过新颖的形式和强烈的视觉效果体现出来。

图5是墨西哥门铃产品的标志,手法的质感洋溢着生命力与直觉感,让人不再关心僵硬的线条和圆滑的笔触。这个标志能运用简单明了而切中要害的方式唤起人们的情感反应。采用幽默而不是严肃的表达方式是标志设计中常用的创意手法,它能使作品让人过目不忘。

图5 墨西哥门铃品牌标志

5.艺术性

艺术性是标志作品必须承载的又一主要特征,完美的艺术表现能塑造良好的标志形象,突出标志鲜明的视觉特征。标志作品让观众产生愉悦的审美感受,标志的信息才能更有效地传递。同时,高度艺术化也是时代和文明进步的需要,是人们提高文化素养和满足审美心理需要。

标志创意设计必须符合设计形式美法则,充分展现其艺术特征,满足大众的审美心理。表现在构图美观,简洁明了,视觉冲击力强与企业定位或商品的形象风味相符,具有强烈的时代感,并遵循设计美的规律,创造性地探索理想的表现形式。如第九届全国运动会标志(如图6),标志以阿拉伯数字“9”作为造型,体现九运会的信息和主办地市的首字母,色彩搭配为红、黄、蓝三种色,代表着富于情感、活泼开朗,充满着喜悦和希望,热情奔放,坚韧不拔。标志视觉冲击力强,宛如一位身手矫健、充满朝气、奋发向上的运动员,健步跨进新世纪。

图6 第九届全国运动会标志

6.文化性

标志作为一种十分重要的社会形象,是一种社会文化沉积,一种深厚文化的符号积累。文化世界实质上是一个符号的世界,这种象征符号不但传递了某一商品、劳务或企业的有关信息,而且传播着文化,成为社会文化的象征。许多消费者选择某种名牌商品,不仅仅是出于对商品本身的信赖,更在于他们认同了品牌中传达出来的深层含义。在标志设计中体现国家性质的影响,在全世界各种体制的国家都很普遍。如美国的许多不同行业的标志形象中都有红蓝色彩与五星的图形因素,鹰的造型也频频出现(如图7);在日本的众多设计中,富士山形象亦频频出现(如图8);韩国的太极图更是几乎充斥着各个领域。此外,加拿大的枫叶、瑞士的红十字等都在告诉我们这种影响的深远。

图7 美国一家保险公司标志

图8 富士银行标志

我国是四大文明古国,有着丰厚的文化遗产和人文气息,它为我们设计提供了肥沃的土壤,很多创意都可以源源不断地得到源泉。如凤凰是吉祥平安的化身,所到之处无不祥和安康,这个传统正与航空业要求的安全、舒适、快捷的服务理念相吻合,于是中国航空公司凤凰形象的标志就自然而然产生(图9)。现代标志设计中很重要的是将标志内含的理念,抽象精神,通过视觉符号表达出来。

图9 中国航空公司标志

7.象征性

象征性是标志的本质特征,标志设计大多通过比喻、暗示、隐喻、象征等较为抽象的形式表达出来,这是由标志的信息化特征和个性特征所限定的。对一件标志作品,我们必须善于从自然物中寻找其意念的对应物,通过强烈的视觉形象,运用暗示、联想、隐喻等手法来表达美好的寓意和特定的象征。只有这样,标志的信息化特征和个性化特征才能得到发挥。雀巢公司标志通过象征性表现使传达的信息对用户产生了深刻的影响(如图10)。

图10 雀巢公司标志

二、标志创意策略

展开创意的思路进行设计,策略是多种的。同一个主题标志,可以有不同的设想和思维方式,最初阶段创意元素可以用横向、纵向、求异的思维方式来进行创意,尽可能地对创意进行多方面思考,从不同的侧面、不同的角度去发现和捕捉素材中较具典型意义的某些创意切入点。

1.以直接表现事物的特征为切入点

从事物形象特征方面,应抓住其表现对象的特点,寻找标志创意设计的切入点。如表现音乐的特征,表现节日喜庆的特征,表现动物形态的特征,表现体育运动的特征等。

如美能达照相机标志(图11),该标志是由椭圆形构成,象征照相机的镜头,椭圆中有一组凸透镜,并运用超现实的视觉形式,表达了美能达相机拍摄画面的清晰度及灵敏度。流动的波状极富有弹性,形成内动的视觉趣味中心,体现了产品制作时技术精良而优越的性能。

图11 美能达照相机标志

2.以项目主题及精神理念为切入点

凡是优秀、内涵丰富的标志,都是以项目的标题、主题及精神理念作为切入点来挖掘创意的,也有根据不同项目的具体主题精神理念来进行创意。

如彪马运动鞋标志设计(图12)运用一只向前一跃的虎和品牌名称的形象结合,虎的腾空飞奔,寓意穿上此品牌运动鞋的运动健将将不畏艰难与阻挡,勇往直前,直至夺取胜利终点,颇具豪迈气概。

图12 彪马运动鞋标志

3.以历史文化和地域特征为切入点

每个国家、民族、地区都有文化沉积和人文气息,文化常成为设计者灵感发源地,有意无意体现在标志的设计中,使标志更加具有独特性和文化意蕴。

中国银行标志(图13)以中国古老的古钱币造型为基础,以结了红绳的“中”字互相结合,古钱币象征银行服务的内涵,上下连贯的直线寓意联营服务。标志之意准确,形象逼真,既体现了民族特色,又具有现代气息,古今结合,造型简练,带给人们古朴淳厚、组织严整、稳健有力的视觉感受,显示出极强的中国气派。

图13 中国银行标志

4.以象征物为切入点

标志创意思路可以从象征物或代表物等方面去考虑,借用具体的物象去表现或代表某种特殊意义和事物。如龙象征中国,鸽子象征和平,火炬象征光明等。美国以鹰和星条旗为象征物,法国则以高昂的公鸡为象征物。以象征的手法进行创意和找到恰当的象征物,可以使标志设计更加富有内涵和深度。如纽约时尚中心标志设计(如图14)用钮扣来做创作标志,一个点引出一面。

图14 纽约时尚中心标志

参考文献:

[1]凯瑟琳・费希尔.2000个世界顶级标志设计.广西美术出版社,2006.12,第1版.

文化自信的特征篇(7)

[分类号]G257 C931.6

1 引 言

好的网站信息分类体系对用户、设计者、管理者和维护者都有利。由于网站信息分类体系往往有不一致、冗余等特点,因此需要调整、优化网站信息分类体系。优化网站信息分类体系时,方法是关键,但目前对网站信息分类体系优化方法的研究还很少。

网站信息分类体系优化是对网站现有信息分类体系进行调整的过程。优化网站信息分类体系时,涉及到聚类标准、大类设置、分类体系展开层次、类目种类、类目名称、类目的均衡性和规律性、交叉关系的处理、类目排列、类目的注释和说明、用户的界面设计等内容。这些内容可以概括为特征、粒度、命名、结构、实现等要素。

考虑到网站信息分类体系和网站信息构建(Infor-mation Architecture,n)、网站开发关系密切,本文结合网站IA和网站开发方法提出了网站信息分类体系优化方法,并应用该方法对国家林业局网站进行了优化分析。

2 网站信息分类体系优化方法

网站IA包含了组织、标识、导航和检索系统。网站信息分类体系是网站组织信息的手段,可以视为网站IA的组成部分。网站IA方法对网站信息分类体系优化方法有借鉴意义。学者们提出了众多网站IA方法,虽然这些方法之间存在着差异,但它们均涉及到了分析、设计、实施(即实现)、评价等工作。网站开发也往往涉及到分析、设计、实现、测试(即评价)等工作。网站IA和网站开发方法中的评价工作主要是评价所实现的新系统,因此评价工作被设定在设计、实现等工作之后。

2.1 优化步骤

参照网站IA和网站开发的一般步骤,本文将网站信息分类体系优化工作也分为分析、评价、设计、实现等阶段。为了提高网站信息分类体系优化工作的效率,本文将评价工作设定在设计、实现等工作之前,从而提出一个在设计、实现等工作之后也可以进行评价优化的信息分类体系。于是,网站信息分类体系优化时可能存在着循环、反复。本文所提出的网站信息分类体系优化方法流程如图1所示:

2.2 优化阶段

优化网站信息分类体系时,分析阶段从特征、粒度(层次)、命名、结构等要素的正确性、适量性、可理解性、相关性、一致性等方面完成对现有信息分类体系的分析;评价阶段完成对网站现有信息分类体系质量的评估,并根据评价结果决定是否需要优化网站现有信息分类体系;按照优化内容的不同,设计阶段可以分为特征优化、粒度优化、命名优化、结构优化等环节;这些环节依次优化现有信息分类体系的分类特征、粒度关系、类别名称、类别间关系;实现阶段的任务是根据设计方案调整网站现有信息分类体系,并描述、说明优化后的体系。

2.3 优化方法

网站信息分类体系优化时,可以借鉴已有方法来完成网站信息分类体系的分析、评价和实现工作。本文借鉴文献中网站信息分类体系的质量框架来分析现有信息分类体系,用文献提出的指标体系来评价网站信息分类体系质量,用网站设计方法来实现网站信息分类体系的调整和描述。于是,本文中网站信息分类体系优化工作的关键挑战是找到设计阶段征优化、粒度优化、命名优化和结构优化等方法。

特征优化的任务是选择最合适的特征组合,可以采用自顶向下方法优化特征。自顶向下特征优化方法是在分类模式的基础上确定候选特征集合,再按照特征覆盖度大小筛选出所需的特征,并对特征进行细微调整得到特征组合;粒度优化时,需要判断粒度粗细是否合适、不同元素间的粒度是否均衡、粒子内部元素之间聚合度高不高,可以使用粗粒度优先方法优化粒度。粗粒度优先的粒度优化是指直接使用最粗的粒度关系或者基于相似度对较细的粒度进行合并、调整;为了保证用户熟悉类别名称,命名优化时要尽量使用通用的词语来命名类别,可以采用基于统计的命名优化方法。基于统计的命名优化是指用统计方法选择出现频率高的现有体系或同类网站中词语来命名类别。命名优化的任务还包括对错误类目名称的调整;结构优化方面往往采用自底向上逐层结构优化方法来优化结构,即在确定网站信息分类体系的层数的基础上,从最细粒度开始到最粗粒度根据类别之间的隶属关系、类别的重要性确定类别的位置。

3 应用上述方法优化国家林业局网站现有信息分类体系

表1是国家林业局网站(forestry.省略)“生态建设”部分现有信息分类体系:

分析上述信息分类体系,可以发现它有以下特点:

・类别偏多。国家林业局网站现有信息分类体系1层所包含的第4层或第3层(没有第4层时)的类别总数为307,而我国中央政府门户网站(省略)和国家农业部网站(agi.省略)1层所包含的类别总量分别只有79和78。

・层数偏多而且不均衡。国家林业局网站现信息分类体系最多有4层,如“生态建设”及其子类就有4层。其中,第3层类别总数为189,有第4层子类的第3层类别占第3层类别总数不到12.2%。体系中第3层和第4层类别的名字长度和子类数量差异比较大,许多类别只有一个子类且上下级类别名称相同(即单一子类)。不同层的类别间还有重名的现象。

・兄弟类别间关系不强。如聚合度不高,且所依据的分类特征不相同。

・现有分类体系中一些类别名称(如“网站地图”、“联系我们”)的含义和通常人们理解的含义不一致,有歧义。

・现有分类体系中很多第4层或第3层类别的信息量比较少。

・现有分类体系中政务公开相关的类别偏少,无法体现电子政务网站的特点。

分析这些特点,可以发现:国家林业局网站现有信息分类体系存在着类别偏多、粒度偏细、层次偏多的问题。这使得设计现有信息分类体系时需要大量的分类标准,从而增加了网站信息分类体系设计工作的难度。进而导致了现有体系存在着名称重复、兄弟类别之间聚合度不高、大量单一子类等问题。根据上文对现有体系的分析和文献中对现有体系的质量评价结果,可以知道现有体系还需要进行优化。已有的分析、评价为设计工作指明了方向:可以采用减少特征、粗化粒度、减少类目数量、减少层次、减少命名歧义性、提高命名长度一致性等措施来优化国家林业局网站现有信息分类体系。

按照自顶向下特征优化方法,先确定网站信息分类体系第1层类别的候选特征集合。林业电子政务网站有主题、原型、功能、实现、对象、地域、时间、角色等分类模式。考虑到网站侧重于监管、林业信息化建设相对薄弱等情况,可以以主题、原型为主要分类模式。应用主题分类模式时,从产业视角可以划分成木材加工、经济林果、苗木花卉、生态旅游、生物质能源等类别,从业务视角可以划分成造林绿化、防沙治沙、自然保护等类别。应用原型分类模式时,可以划分成文件、公告、公示等公文类别。用同样的分析方法,可以得到业务、产业、市场、公文类别、来源、媒体、语言、技术、交互方式、可实现的任务、相关机构、相关人物、时间、地域等特征组成的候选特征集合。通过对国家林业局网站现有信息进行归类,考虑到特征覆盖度的大小,可以筛选出业务、资源形式、交互目的、产业等四种分类特征。另外,考虑到网站信息分类体系中有许多链接到独立网站的类别,可以增加导航特征。因此,优化后的信息分类体系有业务、资源形式、交互目的、产业、导航等分类特征。

文化自信的特征篇(8)

一、 新闻信息的纪实性及其文化特征 

纪实性是新闻信息基本的传播特征  它是衡量信息是新闻还是 旧闻的惟一尺度 ,也是新闻的价值所在从一定意义上讲,新闻信息就是事物存在的方式或运动的状态 以及这种方式或状态的及 时的表述 新闻的纪实性有 多层涵义 其一 ,它要求 新闻所传递 的信 息新颖、及时,能够引起受众的关切和兴趣 .对受众产生吸引力。

其二 ,纪实性意味着新闻传播价值是由时间法则决定的。新闻的时间法则要求传者努 力缩短信息流通时间 ,将新闻报 道和 的时间规定在离 事实发 生或发现 的 “最近点 ”,以适应信息社会快节奏文化的需要。

其三 ,从新闻的宣传价值 ,从体现一定 时代 、一定社会集 团利益的新 闻文化观看来 ,新闻的纪 实性还标志着报道时间~—更准确地说 ,应是新闻面世 时间——恰 到好处地适应了社会的需要 人们把新闻的这种“纪实性”称之为“时直性”。新闻的时宜性往往表现为某一具有特殊意义 (或称文化意义的时间,客观事实只有适应这一时间的事态变动 ,才能成为新闻,或成为更具传播价值 的新闻。

二、新闻信息的事实性及其文化特征

如果说纪实性是新闻的时间特性的话 ,事实性则更 多地体现为新 闻的空间特性  新闻不仅要快速反映新 闻对象在时间中的运动状态 .还要反映它在空 间结构上的存在状态。新闻对象在空间结构上的存在状态 即以人的实践活动为中介的事实的发展和变动。

需要注意的是 .新闻所报道的事实都具有~定时空环境 ,时空含量是事 实的映像。同样的事实 ,很可能由于时空条件的不同.而带来截然不同的社会效应 这便是新闻事 实的相对性所蕴含的文化意义  美国哥伦 比亚大学 新闻学教授麦尔文.曼彻尔说 “新闻显然是一个相对的概念 ,它随着地理、人 口和时间而变化  一个世纪以来 ,80%的美国人 以农业为主 .所以农业新 闻是重要 的  今天 ,只有不到百分之八 的人 1:3干农业 .那么 在农 业区以外 .只有 当农业 的结 果影响到城市居民生活的时候 ,农业新 闻才是重要 的。 ”在我们这个由农业大国向 工业 大国过渡的国家,也会遇到类似的情况。 

三、新闻信息的真实性及其文化特征 

新闻学学者刘建明认为 :“新闻中每个事实必须完全符合客观实际  而一系列报道又能如实地反映客观世界 的整体 ,叫新 闻的真实性。”新闻对客观事实的报道是否真实,实际上往往取决于报道主体的认识水平和观察角度.这在很大程度上又是一个文化观念问题 就事实而言 ,真 实性应该像一个擦得通 明透亮的三棱镜 ,能够让 受众通过它的折射一览无余地看到事实的真相。然而 ,生活在一定文化价值体系中的报道主体,总是 自觉或不 自觉地让 “三棱镜 ”蒙上某种阶级 或集 团的色彩 ,使 它游离 于客 观范畴之外 .而呈现 出形形色色的文化特征。所 以说 ,新闻的真实性具有两面性一面是它的客观性 ,或日“非文化形 ” 另一面是 它的主观性 .或日“文化形”。那就是,我们 不得不承认 ,新闻真实性包含有主观因素 ,显示 出文化特征 。因为新闻的真实与否毕竟是通过人的认知和反映来实现的 

文化自信的特征篇(9)

一、 新闻信息的纪实性及其文化特征

纪实性是新闻信息基本的传播特征 它是衡量信息是新闻还是 旧闻的惟一尺度 ,也是新闻的价值所在从一定意义上讲,新闻信息就是事物存在的方式或运动的状态 以及这种方式或状态的及 时的表述 新闻的纪实性有 多层涵义 其一 ,它要求 新闻所传递 的信 息新颖、及时,能够引起受众的关切和兴趣 .对受众产生吸引力。

其二 ,纪实性意味着新闻传播价值是由时间法则决定的。新闻的时间法则要求传者努 力缩短信息流通时间 ,将新闻报 道和 的时间规定在离 事实发 生或发现 的 “最近点 ”,以适应信息社会快节奏文化的需要。

其三 ,从新闻的宣传价值 ,从体现一定 时代 、一定社会集 团利益的新 闻文化观看来 ,新闻的纪 实性还标志着报道时间~—更准确地说 ,应是新闻面世 时间——恰 到好处地适应了社会的需要 人们把新闻的这种“纪实性”称之为“时直性”。新闻的时宜性往往表现为某一具有特殊意义 (或称文化意义的时间,客观事实只有适应这一时间的事态变动 ,才能成为新闻,或成为更具传播价值 的新闻。

二、新闻信息的事实性及其文化特征

如果说纪实性是新闻的时间特性的话 ,事实性则更 多地体现为新 闻的空间特性 新闻不仅要快速反映新 闻对象在时间中的运动状态 .还要反映它在空 间结构上的存在状态。新闻对象在空间结构上的存在状态 即以人的实践活动为中介的事实的发展和变动。

需要注意的是 .新闻所报道的事实都具有~定时空环境 ,时空含量是事 实的映像。同样的事实 ,很可能由于时空条件的不同.而带来截然不同的社会效应 这便是新闻事 实的相对性所蕴含的文化意义 美国哥伦 比亚大学 新闻学教授麦尔文.曼彻尔说 “新闻显然是一个相对的概念 ,它随着地理、人 口和时间而变化 一个世纪以来 ,80%的美国人 以农业为主 .所以农业新 闻是重要 的 今天 ,只有不到百分之八 的人 1:3干农业 .那么 在农 业区以外 .只有 当农业 的结 果影响到城市居民生活的时候 ,农业新 闻才是重要 的。 ”在我们这个由农业大国向 工业 大国过渡的国家,也会遇到类似的情况。

三、新闻信息的真实性及其文化特征

新闻学学者刘建明认为 :“新闻中每个事实必须完全符合客观实际 而一系列报道又能如实地反映客观世界 的整体 ,叫新 闻的真实性。”新闻对客观事实的报道是否真实,实际上往往取决于报道主体的认识水平和观察角度.这在很大程度上又是一个文化观念问题 就事实而言 ,真 实性应该像一个擦得通 明透亮的三棱镜 ,能够让 受众通过它的折射一览无余地看到事实的真相。然而 ,生活在一定文化价值体系中的报道主体,总是 自觉或不 自觉地让 “三棱镜 ”蒙上某种阶级 或集 团的色彩 ,使 它游离 于客 观范畴之外 .而呈现 出形形的文化特征。所 以说 ,新闻的真实性具有两面性一面是它的客观性 ,或日“非文化形 ” 另一面是 它的主观性 .或日“文化形”。那就是,我们 不得不承认 ,新闻真实性包含有主观因素 ,显示 出文化特征 。因为新闻的真实与否毕竟是通过人的认知和反映来实现的

文化自信的特征篇(10)

(EI village已经收录本文)

李龙梅     张暴暴    冯辛安    刘晓冰

(大连理工大学CIMS中心  大连  116024)

 摘要:CAD/CAM是CIMS的核心,基于特征的产品建模是实现CAD/CAM集成的关键,本文通过分析典型CIMS中工程设计分系统功能模型,给出CIMS环境下CAD/CAM产品特征模型。

关键词:特征    产品信息模型   CAD/CAM

中图号:TP39

1.        CIMS集成产品模型与CAD/CAM基于特征的产品模型        计算机集成制造系统CIMS作为新一代工厂自动化模式之一覆盖了产品的整个生命周期。机械产品的生命周期包括从产品的市场需求分析、立项论证、生产决策、产品设计、工艺设计、加工制造、装配、测试到销售和售后服务的全过程。CIMS集成产品模型是产品生命周期中全部数据的集合,它是整个CIMS研究和处理的对象,所有类型的产品信息都集中储存在这个集成的产品信息模型中,信息的表达已将产品生命周期中的不同阶段都考虑进去,是整个企业在生产周期的任何阶段能共享的信息模型,它能在整体上和局部级上支持各种应用活动,使得面向制造、面向装配、面向质量等成为可能。集成产品模型是以用户需求、市场分析为出发点,以产品设计制造模型(CAD/CAM的模型)为基础,在产品整个生命周期内不断扩充、不断更新版本的动态模型。它应能克服以往仅从某一特定阶段的数据需求和数据处理的特点来建立数据模型,改善对产品产品生命周期中所有数据需求的全局分析的不足,而使得在产品生命周期中各阶段实现信息交换与共享。

 

    工程设计分系统CAD/CAM是CIMS的核心。 CAD/CAM就是按照产品设计-制造的实际进程,在计算机里实现应用程序所需要的信息处理和交换,形成连续的、协调的和科学的系统。实现CAD/CAM一体化的关键在于信息的集成。基于特征的产品模型,是实现CAD/CAM有效集成最佳方法,是CIMS集成产品模型的一个子集,是集成产品模型的基础模型,也是CAD/CAM系统中数据共享的核心。

    传统的基于实体造型的CAD系统仅仅是几何形状的描述,缺乏对产品零件信息的完整描述,与制造所需信息彼此是分离的,从而导致CAD/CAM系统集成的困难。将特征概念引入CAD/CAM,出现了产品特征模型。基于特征的建模是CAD建模的一个新的里程碑,它是CAD/CAM技术的发展和应用到达一定水平,要求进一步提高生产组织的集成化及自动化程度的历史进程中逐步发展起来的。基于特征的建模着眼于更好地表达产品的完整技术和管理信息,为建立产品集成信息模型服务,它使产品设计在更高层次上进行,设计人员的操作对象不再是原始的线条和体素,而是产品的功能要素,直接体现了设计意图,使建立的产品模型容易为非设计人员理解并便于组织生产,设计图样更容易修改,有助于加强产品设计、分析、工艺准备、加工检验各部门之间的联系,更好地将产品设计意图贯彻到下游环节,并及时得到意见反馈。因此特征建模是解决产品模型建立的可靠途径,于是出现了许多关于特征建模的研究。

    对特征技术的研究工作,主要可以概括为七个方面:特征的定义与分类、特征识别、特征建模、特征表达、特征检验、特征映射和特征数据库。特征的定义和分类的研究是特征技术研究的基础,但到目前为止,对特征定义和分类的研究还没有形成一个统一的标准,这是因为特征的定义和分类受到特征研究应用背景的制约。CAD/CAM的特征建模究竟应当包含哪些特征,各说不一。作者认为,作为CIMS的核心--CAD/CAM系统的开发应用,完全可以按照CIMS信息集成的概念进行,由于CAD/CAM最终要集成到CIMS中,基于特征产品模型最终要为CIMS中所有子系统共享,所以在研究特征造型时不仅需要考虑CAD/CAM本身的信息需求,而且需考虑其在CIMS中的地位、作用及其与CIMS中其它分系统之关系。本文就是通过研究典型CIMS中工程设计分系统功能模型各二级子系统的信息需求、本分系统与其它分系统信息联系,得出基于特征的建模应包含的特征定义与分类。

2.  CIMS中工程设计分系统的功能模型     一般可以将CIMS分为四个功能分系统和两个支撑分系统。四个功能分系统分别是工程设计分系统、管理信息分系统、制造自动化分系统和计算机质量保证分系统。两个支撑分系统分别是数据库和网络支撑分系统。

    图(1)所示为典型的工程设计分系统的功能模型图。工程设计分系统由产品数据管理(PDM)、产品设计、工艺设计和制造准备四个二级子系统组成。从这个图中我们可以清楚地看出系统内部数据信息的需求和流动。首先通过PDM将产品开发计划、生产经营计划管理等信息传到产品设计模块,将产品设计模块输出产品的技术报价、BOM表、图纸、技术文档等信息所形成的产品设计模型返回到PDM;工艺设计分系统从PDM中获取有关信息,完成工艺设计并将设计结果,如:工艺规程、专用工装图等技术文档返回PDM;制造准备模块从PDM中获得信息,编制数控加工、夹具需求计划等制造数据信息和各类技术文档返回PDM。产品设计、工艺设计和制造准备之间的信息通过PDM传送,改善数据的统一性和安全性。最后形成的基于特征的产品模型就存在于PDM中了。

       工程设计分系统的输入信息是市场信息和管理信息分系统传递的生产管理信息,输出O1将又成为质量保证分系统、制造自动化分系统、管理信息分系统的输入。在CIMS环境下,工程设计分系统应与生产管理、质量管理、制造自动化集成起来,因此特征建模时,应考虑这些分系统的信息需求。例如,质量保证分系统的功能是规划和执行企业的质量保证活动,它需要工程设计分系统提供有关产品几何数据、零件、原材料的基本数据、图纸、零件明细、产品结构、标准规范、加工、装配与检测规程和程序等,并从质量保证角度向CAD模块提出产品质量方面的要求和修改设计的意见,提出有关质量方面的要求和达到质量要求建议采取的措施,通过生产控制和维修实现质量控制。由于安排生产作业计划、物料需求计划、能力平衡计划、合同管理、仓库管理等需在管理信息分系统中完成,所以管理信息分系统与工程设计分系统之信息交换包括:供应商、用户基本数据,用户订单和车间下达任务的有关数据、图纸、零件明细、产品结构有关工具、消耗品数据、工艺规程等。

 

3.  特征的定义与分类   3.1特征的定义    在一个产品整个生命周期中产生的信息很多,其中包括:设计信息、制造信息、管理信息、质量信息、使用和维护信息等。这些信息又被CIMS中其它系统以不同的方式使用。产品设计初始特征模型是由设计人员建立的,然而在产品整个生命周期内,这个特征模型的不断完善需要设计师、工艺师、质量检测人员等的共同协作。

       本文对特征的定义是在CIMS环境下,特征是产品生命周期内信息完整描述的载体,特征是一种信息表示方法,包括几何信息和非几何信息。

  尽管特征的定义由于应用的不同而有差异,但特征的性质和作用是基本一致的。首先特征是低层的几何元素与零部件间联系的桥梁,特征将构成特征的几何元素有机地结合起来,形成能够表达特定功能或含义的形状结构,以体现面向应用的形状信息;此外,特征的组成元素可以作为尺寸 公差、表面粗糙度等加工信息的相关载体,使得工艺信息能完整地借助特征而得到表达。基于特征的产品模型不仅能支持各种应用所需的产品定义信息,而且能提供符合人们思维的高层次工程描述术语,并反映设计和制造意图,从而克服现行CAD/CAM系统中产品信息定义不完备性和低层数据抽象性的不足。为CAD/CAM信息的真正集成、及其向CIMS的集成提供保障。

       特征除了具有一定的几何信息以外,还包括在设计、工艺规划和制造过程中需要技术、功能等信息,即特征给各种数据赋予了一定的语义。特征建模所需处理的数据纷繁复杂,系统中的数据类型繁多,数据之间的关系也十分复杂,既包括反映产品形状几何拓朴信息的几何模型,又有反映设计结构功能的设计模型,还需处理具有加工特点和装配特性的制造模型,既要存储静态的产品标准、规范等信息,又要涉及动态产品设计、制造过程信息。

3.2特征的分类     在对CIMS工程设计分系统各子系统信息交换分析的基础上,从特征建模的角度出发可以将零件特征分以下6类:

    1)形状特征:零件上有一定拓扑关系的一组几何元素所构成的一个特定形状。它具有特定的功能及其特定的加工方法集。形状特征可以分为主形状特征和辅形状特征。其中主形状特征用于构造零件的主体形状(如圆柱体、圆锥体等),辅形状特征用于对主特征的局部修饰(如倒角、键槽、退刀槽、中心孔等)。辅形状特征附加于主特征之上,或附加于另一辅特征之上,根据辅特征的特点还可以将之进一步划分为简单辅特征、组合辅特征和复制辅特征。简单辅特征是指如倒角、退刀槽等单一特征;组合辅特征是由一些简单辅特征组合而成的特征如阶梯孔等;复制辅特征是同一辅特征按一定规律在空间不同位置上复制而成的特征,如周向均布孔、矩阵列孔等。也可以按获得形状的加工方法不同将形状特征分类。

    2)精度特征:用于表达零件各要素尺寸公差、形状公差、位置公差和表面粗糙度等精度要求信息。需特别指出的是,一般形位公差除公差项目名、公差值、基准外,还应包含公差检测原则(如包容原则、最大实体原则等)。精度特征是形成零件质量指标的主要依据。

        3)管理特征:用于描述零件的管理信息,如标题栏中的设计者、批量、一台份的件数、零件与其它产品的借用与通用关系、日期、编码以及生产管理中MRP-II所需信息,和设计过程管理,包括版本管理,使用者权限设定与管理,审定等,并为PDM提供所需的信息。

       4)技术特征:用于描述零件的性能、功能等相关信息。说明外观要求、搬运要求等图纸上无法在图上标注的要求,零件运行过程中工况条件(常规、极限),载荷与约束条件,为CAE提供模拟信息,为性能实验,分析计算、优化,有限元前处理提供条件。

   5)材料特征:用于描述零件材料的类型、理化指标及热处理等特殊要求、表面处理的信息集合。

   6)装配特征:用于表达零件在装配过程中所需用的信息,如与其它零件之配合、配作等关系,装配尺寸链信息、父项子项的信息。为装配工艺提供必要的信息。如组成产品的零部件之间在装配中的关系可分为:

   层次关系:机械产品是由具有层次关系的零部件组成的系统

   装配关系:包括描述实体模型几何元素之间直接的相互关系的几何关系,比如平面贴合、点面接触相切;描述零部件之间高于几何测层次的机械关系,如螺纹联接、键联接等;描述零部件之间运动关系(相对运动或传递运动),如相对转动,齿轮传动等。

   参数约束关系:设计中的参数分为两大类,一类是从上一层传递下来的参数,本层设计部门必须满足,而且无权直接修改,称之为继承参数,一类是设计中产生的新参数,它们有的是从继承参数中导出的,有的是根据当前设计需要制定的统称为生成参数。当继承参数改变时,相关的生成参数要随之调整。

        以上特征中,形状特征和精度特征是与零件建模直接相关的特征,而其余特征是CAPP系统选择毛坯、下料、制定工艺的依据,是质量保证系统制定质量检测规划的依据。特征之间的关系有反映主形状特征之间的空间相互位置关系的邻接关系;辅助特征从属于一个主特征或另一个辅特征时构成的附属关系;描述特征类之间关联属性而相互引用的引用关系;不同层次特征之间的继承关系等。

    以上特征是根据产品的对象定义的,支持产品生命周期多个阶段的通用特征,不同阶段之间的信息传递主要是通过基本特征这个信息载体,又可以称为基本特征。基本特征对不同应用领域具有不同视口、不同投影与继承,是特征模型支持下游操作和模型本身不断完善的途径。各个分系统结合各自不同信息,就形成了各自的应用特征,如工艺特征、制造特征、检测特征。所以应用特征,是面向具体应用领域或具体应用系统的专用特征,它满足具体系统的操作要求,同时它的信息是可以从基本特征中导出的。

 

          

图1 工程设计自动化分系统功能模型图

  

Feature-Based  Product  Model  In  CIMS 

Li Longmei, Zhang Baobao, Feng Xinan, Liu Xiaobing

(CIMS Centre of Dalian University of Technology, Dalian, P.R. China, 116024)

 

ABSTRACT:  CAD/CAM is a core element in CIMS, and hence the feature-based product modeling is the key to CAD/CAM integration. In this paper, a typical functional model of automatic engineering design system of  CIMS  is  analyzed,  and the definition and classification of features in CIMS-oriented and feature-based product modeling are discussed.

Keywords:  Feature, Product information model, CAD/CAM

 

参考文献

[1]冯辛安主编,CAD/CAM技术概论,北京:机械工业出版社.1995.

[2]贺建平、丁秋林、孙正兴,基于特征的产品信息建模技术研究,计算机辅助设计与制造,96(3).

[3]肖田元,CIMS与先进制造技术,工程设计CAD及自动化,96(4).

上一篇: 古诗教学思考 下一篇: 对茶文化的理解
相关精选
相关期刊