關(guān)于我們 | 聯(lián)系我們 | 定制服務(wù) | 訂購流程 | 網(wǎng)站地圖 設(shè)為首頁 | 加入收藏

熱門搜索:汽車 行業(yè)研究 市場研究 市場發(fā)展 食品 塑料 電力 工業(yè)控制 空調(diào) 乳制品 橡膠

當(dāng)前位置: 主頁 > 產(chǎn)業(yè)觀察 > IT通訊 >  2013年中國非結(jié)構(gòu)化信息概述

2013年中國非結(jié)構(gòu)化信息概述

Tag:信息  

中國產(chǎn)業(yè)研究報(bào)告網(wǎng)訊:

    在信息處理領(lǐng)域,按照信息的類型和處理方法不同,信息處理分為結(jié)構(gòu)化信息處理和非結(jié)構(gòu)化信息處理。結(jié)構(gòu)化信息,又稱結(jié)構(gòu)化數(shù)據(jù),如財(cái)務(wù)報(bào)表、統(tǒng)計(jì)報(bào)表、股票行情等,它們都有一定的結(jié)構(gòu),通常以表格的形式表達(dá)。結(jié)構(gòu)化信息處理主要基于對數(shù)值進(jìn)行計(jì)算,如比較大小、排序、求和等數(shù)學(xué)或邏輯運(yùn)算,并根據(jù)計(jì)算結(jié)果控制計(jì)算機(jī)系統(tǒng)運(yùn)行。 

    內(nèi)容選自產(chǎn)業(yè)研究報(bào)告網(wǎng)發(fā)布的《2013-2018年中國信息技術(shù)產(chǎn)業(yè)發(fā)展前景預(yù)測與投資風(fēng)險(xiǎn)分析報(bào)告

    非結(jié)構(gòu)化信息,就是相對于結(jié)構(gòu)化信息而言,比如公司公告、新聞、調(diào)研分析報(bào)告、圖片等等,它們通常以文檔、網(wǎng)頁、電子郵件、圖像,甚至如視頻和音頻等多媒體類型存在。這類信息很難用統(tǒng)一的數(shù)據(jù)模型描述其結(jié)構(gòu)和關(guān)聯(lián)關(guān)系或者與特定應(yīng)用相關(guān)的復(fù)雜類型的數(shù)據(jù),不方便或無法用關(guān)系數(shù)據(jù)庫系統(tǒng)進(jìn)行存儲和處理的數(shù)據(jù)。非結(jié)構(gòu)化信息處理不是基于數(shù)學(xué)和邏輯運(yùn)算,而主要是基于“理解”信息內(nèi)容,包括各種形式的分類、檢索、信息抽取、內(nèi)容匹配等多種方法,將“理解”的結(jié)果提供給使用者或控制計(jì)算機(jī)系統(tǒng)運(yùn)行。 

    結(jié)構(gòu)化和非結(jié)構(gòu)化信息管理在企業(yè)信息化應(yīng)用中的定位

    結(jié)構(gòu)化和非結(jié)構(gòu)化信息管理在企業(yè)信息化應(yīng)用中的定位

    非結(jié)構(gòu)化信息規(guī)模暴增,是非結(jié)構(gòu)化信息處理技術(shù)和軟硬件產(chǎn)品市場需求快速增長的主要原因 

    IDC與EMC公司2010年5月5日發(fā)布題為《數(shù)字宇宙十年——你是否準(zhǔn)備好?》的研究結(jié)果,這是第四次測算數(shù)字宇宙的突破性數(shù)據(jù)增長速度,估量和預(yù)測全球每年創(chuàng)建和復(fù)制的海量數(shù)字信息,以及它對個(gè)人和IT專業(yè)人士的影響。 

    報(bào)告表明在2009年經(jīng)濟(jì)大蕭條時(shí)期,數(shù)字信息量比2008年增長了62%,達(dá)到8000億GB(0.8ZB)。而2010年產(chǎn)生的數(shù)字信息量將達(dá)到1.2ZB。每年創(chuàng)建的數(shù)字信息量從2009年到2020年將增長44倍,聲音、電視、廣播、打印等所有主要的媒體形式都將完成從模擬到數(shù)字的轉(zhuǎn)變,全球數(shù)字信息總量將達(dá)到35ZB。如果用DVD記錄,一張張疊加起來的長度可以往返地球與月球之間。 超過70%的數(shù)字宇宙由個(gè)人產(chǎn)生。但80%的數(shù)字宇宙需要由企業(yè)存儲、保護(hù)和管理。由于社交網(wǎng)絡(luò)和Web 2.0技術(shù)不斷滲透到企業(yè),企業(yè)責(zé)任將有增無減。2007年IDC關(guān)于數(shù)字宇宙的報(bào)告預(yù)測,到2010年,中國的數(shù)字信息量預(yù)計(jì)為900.5億多GB,是2006年的7倍,超過全球的增長速度(6倍)。實(shí)際上在上述2010年IDC的報(bào)告中稱過去幾年對于數(shù)據(jù)增長的預(yù)測嚴(yán)重低估了數(shù)據(jù)的生成量,顯然,數(shù)據(jù)增長的速度在加快,2010年到2020年這十年時(shí)間中將創(chuàng)建更多的數(shù)據(jù),意味著普通企業(yè)將面臨數(shù)據(jù)迅猛增長帶來的信息管理方面的挑戰(zhàn)。 

    按照Gartner的預(yù)測,文本、格式文檔、表格、電子郵件、圖像和音視頻等非結(jié)構(gòu)化信息占機(jī)構(gòu)中信息總量的80%以上,正成為增長最快的信息類型。政府部門是信息資源的最大擁有者,掌握的信息甚至達(dá)到全社會信息總量的80%。政府部門擁有大量不同格式、不同載體的政務(wù)信息資源,包括政策、法規(guī)、計(jì)劃、公文、檔案、報(bào)告、統(tǒng)計(jì)數(shù)據(jù)等,這些信息資源缺乏統(tǒng)一規(guī)劃,共享程度低,利用率不高,影響了政府提高決策執(zhí)政效率和推進(jìn)政務(wù)公開,影響了電子政務(wù)為企業(yè)和社會公眾服務(wù)目標(biāo)的實(shí)現(xiàn)。除政府以外,越來越多的企業(yè)也認(rèn)識到信息正在影響和驅(qū)動著整個(gè)企業(yè)中許多至關(guān)重要的業(yè)務(wù)過程。這些重要信息包括產(chǎn)品技術(shù)規(guī)格、營銷材料、網(wǎng)頁、客戶服務(wù)數(shù)據(jù)、供應(yīng)商合同、電子郵件、圖片資料等,其規(guī)模正在成倍地增長,隱含著企業(yè)在金錢和時(shí)間上的巨大投資,是企業(yè)重要的信息資產(chǎn),對其有效管理并挖掘信息價(jià)值,能夠給企業(yè)帶來超值回報(bào)。當(dāng)前,應(yīng)用非結(jié)構(gòu)化信息處理技術(shù)正成為政府機(jī)構(gòu)和企事業(yè)單位信息管理的重要趨勢。