2013年中國非結(jié)構(gòu)化信息概述
中國產(chǎn)業(yè)研究報(bào)告網(wǎng)訊:
在信息處理領(lǐng)域,按照信息的類型和處理方法不同,信息處理分為結(jié)構(gòu)化信息處理和非結(jié)構(gòu)化信息處理。結(jié)構(gòu)化信息,又稱結(jié)構(gòu)化數(shù)據(jù),如財(cái)務(wù)報(bào)表、統(tǒng)計(jì)報(bào)表、股票行情等,它們都有一定的結(jié)構(gòu),通常以表格的形式表達(dá)。結(jié)構(gòu)化信息處理主要基于對數(shù)值進(jìn)行計(jì)算,如比較大小、排序、求和等數(shù)學(xué)或邏輯運(yùn)算,并根據(jù)計(jì)算結(jié)果控制計(jì)算機(jī)系統(tǒng)運(yùn)行。
內(nèi)容選自產(chǎn)業(yè)研究報(bào)告網(wǎng)發(fā)布的《2013-2018年中國信息技術(shù)產(chǎn)業(yè)發(fā)展前景預(yù)測與投資風(fēng)險(xiǎn)分析報(bào)告》
非結(jié)構(gòu)化信息,就是相對于結(jié)構(gòu)化信息而言,比如公司公告、新聞、調(diào)研分析報(bào)告、圖片等等,它們通常以文檔、網(wǎng)頁、電子郵件、圖像,甚至如視頻和音頻等多媒體類型存在。這類信息很難用統(tǒng)一的數(shù)據(jù)模型描述其結(jié)構(gòu)和關(guān)聯(lián)關(guān)系或者與特定應(yīng)用相關(guān)的復(fù)雜類型的數(shù)據(jù),不方便或無法用關(guān)系數(shù)據(jù)庫系統(tǒng)進(jìn)行存儲和處理的數(shù)據(jù)。非結(jié)構(gòu)化信息處理不是基于數(shù)學(xué)和邏輯運(yùn)算,而主要是基于“理解”信息內(nèi)容,包括各種形式的分類、檢索、信息抽取、內(nèi)容匹配等多種方法,將“理解”的結(jié)果提供給使用者或控制計(jì)算機(jī)系統(tǒng)運(yùn)行。
結(jié)構(gòu)化和非結(jié)構(gòu)化信息管理在企業(yè)信息化應(yīng)用中的定位
非結(jié)構(gòu)化信息規(guī)模暴增,是非結(jié)構(gòu)化信息處理技術(shù)和軟硬件產(chǎn)品市場需求快速增長的主要原因
IDC與EMC公司2010年5月5日發(fā)布題為《數(shù)字宇宙十年——你是否準(zhǔn)備好?》的研究結(jié)果,這是第四次測算數(shù)字宇宙的突破性數(shù)據(jù)增長速度,估量和預(yù)測全球每年創(chuàng)建和復(fù)制的海量數(shù)字信息,以及它對個(gè)人和IT專業(yè)人士的影響。
報(bào)告表明在2009年經(jīng)濟(jì)大蕭條時(shí)期,數(shù)字信息量比2008年增長了62%,達(dá)到8000億GB(0.8ZB)。而2010年產(chǎn)生的數(shù)字信息量將達(dá)到1.2ZB。每年創(chuàng)建的數(shù)字信息量從2009年到2020年將增長44倍,聲音、電視、廣播、打印等所有主要的媒體形式都將完成從模擬到數(shù)字的轉(zhuǎn)變,全球數(shù)字信息總量將達(dá)到35ZB。如果用DVD記錄,一張張疊加起來的長度可以往返地球與月球之間。 超過70%的數(shù)字宇宙由個(gè)人產(chǎn)生。但80%的數(shù)字宇宙需要由企業(yè)存儲、保護(hù)和管理。由于社交網(wǎng)絡(luò)和Web 2.0技術(shù)不斷滲透到企業(yè),企業(yè)責(zé)任將有增無減。2007年IDC關(guān)于數(shù)字宇宙的報(bào)告預(yù)測,到2010年,中國的數(shù)字信息量預(yù)計(jì)為900.5億多GB,是2006年的7倍,超過全球的增長速度(6倍)。實(shí)際上在上述2010年IDC的報(bào)告中稱過去幾年對于數(shù)據(jù)增長的預(yù)測嚴(yán)重低估了數(shù)據(jù)的生成量,顯然,數(shù)據(jù)增長的速度在加快,2010年到2020年這十年時(shí)間中將創(chuàng)建更多的數(shù)據(jù),意味著普通企業(yè)將面臨數(shù)據(jù)迅猛增長帶來的信息管理方面的挑戰(zhàn)。
按照Gartner的預(yù)測,文本、格式文檔、表格、電子郵件、圖像和音視頻等非結(jié)構(gòu)化信息占機(jī)構(gòu)中信息總量的80%以上,正成為增長最快的信息類型。政府部門是信息資源的最大擁有者,掌握的信息甚至達(dá)到全社會信息總量的80%。政府部門擁有大量不同格式、不同載體的政務(wù)信息資源,包括政策、法規(guī)、計(jì)劃、公文、檔案、報(bào)告、統(tǒng)計(jì)數(shù)據(jù)等,這些信息資源缺乏統(tǒng)一規(guī)劃,共享程度低,利用率不高,影響了政府提高決策執(zhí)政效率和推進(jìn)政務(wù)公開,影響了電子政務(wù)為企業(yè)和社會公眾服務(wù)目標(biāo)的實(shí)現(xiàn)。除政府以外,越來越多的企業(yè)也認(rèn)識到信息正在影響和驅(qū)動著整個(gè)企業(yè)中許多至關(guān)重要的業(yè)務(wù)過程。這些重要信息包括產(chǎn)品技術(shù)規(guī)格、營銷材料、網(wǎng)頁、客戶服務(wù)數(shù)據(jù)、供應(yīng)商合同、電子郵件、圖片資料等,其規(guī)模正在成倍地增長,隱含著企業(yè)在金錢和時(shí)間上的巨大投資,是企業(yè)重要的信息資產(chǎn),對其有效管理并挖掘信息價(jià)值,能夠給企業(yè)帶來超值回報(bào)。當(dāng)前,應(yīng)用非結(jié)構(gòu)化信息處理技術(shù)正成為政府機(jī)構(gòu)和企事業(yè)單位信息管理的重要趨勢。
行業(yè)分類
最新行業(yè)報(bào)告
- 2017-2022年中國醫(yī)用腹膜透析機(jī)行業(yè)市場監(jiān)測與投資趨勢研究報(bào)告
- 2017-2022年中國股票配資行業(yè)市場監(jiān)測與投資前景預(yù)測報(bào)告
- 2017-2022年中國心電監(jiān)護(hù)系統(tǒng)行業(yè)市場監(jiān)測與投資戰(zhàn)略咨詢報(bào)告
- 2017-2022年中國旋臂起重機(jī)行業(yè)市場監(jiān)測與投資決策咨詢報(bào)告
- 2017-2022年中國助力機(jī)械手行業(yè)市場監(jiān)測與投資方向研究報(bào)告
- 2017-2022年中國搬運(yùn)型機(jī)器人行業(yè)市場分析與發(fā)展策略咨詢報(bào)告
- 2017-2022年中國碼垛機(jī)器人行業(yè)市場監(jiān)測與投資前景研究報(bào)告
- 2017-2022年中國酪蛋白行業(yè)市場分析與發(fā)展策略研究報(bào)告
- 2017-2022年中國單甘酯行業(yè)市場分析與發(fā)展機(jī)遇預(yù)測報(bào)告
- 2017-2022年中國氨基磺酸行業(yè)市場分析與發(fā)展機(jī)遇研究報(bào)告
產(chǎn)業(yè)觀察
- 2016年9月份棕櫚油供應(yīng)趨勢分析
- 中國預(yù)計(jì)2020年啟動5G商用 最高可達(dá)20GB每秒
- 北京將實(shí)行五證合一 社會保險(xiǎn)登記證納入五證合一
- 2016年9月份50個(gè)城市主要食品平均價(jià)格變動情況
- 2016年9月份流通領(lǐng)域重要生產(chǎn)資料市場價(jià)格變動情況
- 2016上半年內(nèi)燃機(jī)行業(yè)的各家上市公司市場的走勢變化分析
- 1-7月份新能源快速增長 比重明顯提高
- 2016年我國醫(yī)療體制改革:布局大健康產(chǎn)業(yè)鏈
- 2016年牛肉行業(yè)市場發(fā)展分析
- 2016年8月份中國消費(fèi)品市場增勢
統(tǒng)計(jì)數(shù)據(jù)
- 2016年10月中國煤氣生產(chǎn)量產(chǎn)量分省市統(tǒng)計(jì)表
- 2016年10月中國風(fēng)力發(fā)電量產(chǎn)量分省市統(tǒng)計(jì)表
- 2016年10月中國核能發(fā)電量產(chǎn)量分省市統(tǒng)計(jì)表
- 2016年10月中國水力發(fā)電量產(chǎn)量分省市統(tǒng)計(jì)表
- 2016年10月中國火力發(fā)電量產(chǎn)量分省市統(tǒng)計(jì)表
- 2016年10月中國發(fā)電量產(chǎn)量分省市統(tǒng)計(jì)表
- 2016年10月中國復(fù)印和膠版印制設(shè)備產(chǎn)量分省市統(tǒng)計(jì)表
- 2016年10月中國電工儀器儀表產(chǎn)量分省市統(tǒng)計(jì)表
- 2016年10月中國彩色電視機(jī)產(chǎn)量分省市統(tǒng)計(jì)表
- 2016年10月中國集成電路產(chǎn)量分省市統(tǒng)計(jì)表