新银河娱乐在线平台官网

  • 郑州设计公司-郑州广告公司-郑州广告设计公司 -包装设计公司-郑州设计

  • 以简约的设计风格而闻名的品牌设计公司
    郑州设计公司
    ?

    新银河娱乐平台设计公司 2017-10-23 点击次数匪忙:633次

    网络时代带给印刷的改变掏,未来会得到更大的体现晃,无人操控网络印刷机器将成为主流印刷机器眠无逼,也许那时候你再监控器下看印刷工作感觉很棒吧!www.mosheji.com

    大量网络数据以文本的形式存在片粹。要获取有效的数据资源枚,就需要对文本进行分析惩氓,获取文本的主题词汾孙衰,即主题词提取朝。所提取的主题词在对文本进行分析时仁番,被用作文本主题的描述词[3]碳毛。主题词是面向信息索引和检索的标准化语言卡,是信息检索的基础京努郊。国内外对主题词提取已开展深入探索和研究瑟。对于小规模文本丹,通过提出相关的文本内容能够提供主题词提取线索纤署槐,从而达到从给定文本中提取主题词的目标[4]北儒。在此方法中方屉,由于充分利用了相关文本所提供的线索湍烧暮,从而能同时处理文本摘要和主题词提取孰赔。对于英文主题词提取而言观,由于英文语言本身的特点举仕船,关注点主要是进行词干加工翁。因此剧类,可以构建出对英文文本的主题词自动提取系统[5]邯渡抹,由于不需要进行分词处理趣屑,因此系统效率较高糠。中文文本的主题词提鹊盐帷,可以从语义的角度进行分析蘑眷患,构建出语义网络接嗓损,使用概念之间的匹配来进行处理[6]虫。通过这种方法能够解决传统方法以关键词进行主题词提取的缺陷侩藩纯。通过对词频率进行分析颅超距,同样可以进行主题词提取彻翻。通过增加文本预处理环节窜疆扣,能够进行合成词的识别投藩边,进而提高主题词提取的满意度[7]擒赶怕。通过主题词提嚷惴省,能够获取文本内容的基本描述孺春魔。现有的主题词提取方法主要关注于一般文本内容狗伦纤,缺少对行业应用领域的背景分析刻。通过对包装印刷行业产品设计要素进行分析饺箱涡,将产品设计要素与主题词的提取进行关联袭泪丁,从而提高数据资源获取效率颈,为包装印刷行业产品设计提供参考肠多。


    2基于产品设计要素的主题词提取算法


    2.1包装印刷行业的产品设计要素分析


    包装印刷行业的产品设计要素分析包装印刷行业中的产品设计剩认滇,不仅是对产品本身特点的关注撩草韩,与应用场景密切相关腿涂滥,还需要与众多的外在设计要素进行关联负郊。而应用场景往往随着时间而发生变化壤,这就要求产品设计能适应应用场景的变化韭,满足新的设计要求半称巾。应用场景的变化与热点事件备寐倪、用户群体特性墨、时节陕观剖、地域等多种外在因素相关箔。这些外在因素往往能在互联网上以文本形式出现燃扒茄,并及时更新笛。因此蜗誓图,通过分析互联网上的文本财,能够及时偿哎、有效地了解潜在的设计要求与设计趋势魂,从而为产品设计提供支持钝蚕。定义包装印刷行业的产品设计要素合S畏。S中包含所有的设计要素耍亲,共n个释慰蓖,记为E1喀,E2磷毋,E3磺珊才,…En觅筹。每个设计要素Ei具有属性A(Ei)和相关系数C(Ei)忙报磨。其中附舵,属性A(Ei)表示设计要素所具有的设计属性迹乃逞,是对设计要素Ei的基本描述;相关系数表示设计要素Ei与产品设计之间的关联程度嘛咀嫁。相关系数C(Ei)实际上表达了设计要素Ei在整个产品设计中的重要程度窝甜,是一个权重系数涎绞乔。


    2.2文本向量空间模型


    文本经过预处理后华附,可以得到分离出来的词火。这些词是从文本当中抽取出来的关键词镣哺,用来表示文本的特征项标,代表文本的性质和特点篮。基于产品设计要素的主题词提取算法采用向量空间模型的方法来表示文本翅。从文本集合向向量空间模型进行映射时斯按瓤,整个文本集合映射为向量空间;文本映射为向量空间中的向量惜,文本的特征项映射为向量的维度统,从而构成完整的文本集合的向量表示形式蜜融。


    2.3基于产品设计要素的主题词提取算法


    主题词提取是文本分析的基础工作算。从式(4)可以发现法,传统的主题词提取方法往往关注文本本身主题词提染赏浴,而包装印刷行业的产品设计靖列,需要关注与行业相关的文本分析疯筒。采用传统方法斥火嚎,会得到大量无关的主题词垒,并获得大量无关的文本邓拖,增加文本分析的难度和工作量隆屉。因此对式(4)权重计算方法进行优化和改进卜挽缆,基于产品设计要素进行主题词提取算法设计佳矫瀑。根据对设计要素的定义抨诡,每个设计要素Ep哺,都有一个C(Ep)鲸,表示Ep对于设计的重要程度聪律。为了反映设计要素在文本中的出现频率奸矫晦、重要程度羡,将C(Ep)作为特征项的一个重要权重系数棵钠挨。


    3实验结果与分析比较


    CF-TF-IDF与传统的TF-IDF之间在特征项提取上的有效性和效率伞。实验数据集为从互联网上抽取的5÷┐阈凇000篇文本数据集合介。实验步骤洛:首先对数据集合进行预处理彤,形成基本的特征项集合;然后按照算法步骤进行特征项提取叛赣们。在预期特征项中酬鹿踏,选择与包装印刷设计要素相关的词作为特征项;然后分别由CF-TF-IDF和TF-IDF的特征项提取结果进行对比吨唾。具体实验结果如图2所示茬蝎。显然峭,DF-TF-IDF在特征项选择上具有比TF-IDF更高的准确率拭坟。TF-IDF只根据文本本身的特点进行特征项提韧帧;因此谱,尽管TF-IDF能够抓住文本的特点翘,并提取特征项头,但由于未考虑包装印刷行业产品设计的特点郝扯,所提取的特征项可能无法体现其与设计要素之间的关系线蛙扣。而CF-TF-IDF方法则通过设计要素权重因子捣书糯,在选择特征项时惦便圭,直接通过权重来进行筛丫逗 ,从而使得特征项选择更符合行业应用设计要求澳。

    上一篇搬谷似: 房地产营销策划概论设计公司

    下一篇戒褂:郑州包装设计公司—你凭什么影响别人

    以简约的设计风格而闻名