大數據時代,對于新聞出版產業來說意味著一個全新的產業格局,大數據的本質是深入的數字化、智能化,不僅強調文化內容產品形態的多樣性,更強調的是將知識服務于用戶。我國新聞出版產業正處在轉型升級的重要時間窗口,及時抓住戰略機遇、突破轉型障礙迫在眉睫。然而,從大數據的發展來看,新聞出版行業在數據的開放性、流動性、交互性尚存不足。靈玖軟件從出版行業的內外部環境、跨界競爭態勢等多重視角,為我國新聞出版產業的大數據戰略升級提供完美解決方案。
出版行業解決方案
靈玖軟件基于大數據解決方案10多年的積累和在大數據應用方面的成功經驗,推出了大數據出版行業解決方案。
知識獲取與挖掘:
NLPIR網絡搜索與挖掘共享開發平臺,針對各種格式文本、信息內容處理的全技術鏈條的共享開發平臺,可廣泛的挖掘處理內容。
專業領域知識圖譜的自動構建:】
1.針對PDF、Word、XML等主流文檔,采用我們的信息抽取組件,抽取出結構化的文本信息。
2.NLPIR-ICTCLAS分詞系統可以融合已有本體庫,實現專業領域的分詞標注。
3.NLPIR-ICTCLAS新詞發現可直接從原始語料中直接發現新詞、新概念。
4.NLPIR-ICTCLAS從新詞中過濾篩選本體概念
5.本體關聯關系計算
POS-CBOW語言模型:加入新概念后的五層神經網絡、
6.專業領域知識關系抽取
7.建立智能語義網,構建語義搜索平臺
文本知識智能語義搜索平臺
語義搜索引擎基于對自然語言理解的技術優勢,針對大數據搜索業務需求而打造的一套搜索引擎。該平臺通過人機互動實現了機器對自然語言的“智能理解”,能夠實現垂直領域專業知識的不斷融合,從而幫助客戶完成大部分的語義分析工作,實現了智能搜索替代信息檢索,給客戶提供真正更加精準的信息內容。