【文章導讀】:1、知識圖譜是人工智能 (AI) 以及人類知識發(fā)展的基礎支柱之一,是對人、物、位置、事件和概念等實體的相互關聯(lián)世界的真實描述,為數(shù)據(jù)集成、管理和分析提供框架。
隨著關聯(lián)數(shù)據(jù)、人工智能以及數(shù)據(jù)分析日益發(fā)展,知識圖譜技術的應用不斷增加,成為各個行業(yè)業(yè)務的主流需求。IDC預測,全球 65%的GDP將實現(xiàn)數(shù)字化,2022年至2023年將推動超過6.8萬億美元的支出。而到2023年,亞太地區(qū)20%的商業(yè)智能將整合知識圖譜。
Neo4j知識圖譜尋找隱藏在復雜關聯(lián)事件中的模式,在更短的間隔內(nèi)以可擴展的方式從具有復雜上下文情景的大量數(shù)據(jù)中獲取有價值的信息,用戶可以對基礎數(shù)據(jù)進行推理并自信地使用其進行復雜的決策。
 
2、整體而言,數(shù)據(jù)科學家并不喜歡數(shù)據(jù)庫,他們更加鐘愛數(shù)據(jù)。而圖數(shù)據(jù)庫是個例外,越來越多的數(shù)據(jù)科學家對圖數(shù)據(jù)庫青睞有加。數(shù)據(jù)科學家使用圖形算法處理數(shù)據(jù),再通過圖將數(shù)據(jù)輸入機器學習管道中,從而為機器學習模型和預測提供關系型信號。由此,圖數(shù)據(jù)庫成為機器學習管道中的核心部分。
不同于關系型數(shù)據(jù)庫,圖數(shù)據(jù)庫以事物的連接方式為中心,強調(diào)數(shù)據(jù)之間的關聯(lián)關系,它將數(shù)據(jù)間的聯(lián)系視為和數(shù)據(jù)本身同等重要。圖數(shù)據(jù)平臺讓用戶能夠在圖數(shù)據(jù)庫上開發(fā)和運行應用程序,它直接將關系和數(shù)據(jù)在物理層面上一并存儲下來,使得訪問數(shù)據(jù)結點和關系的操作能夠以線性時間復雜度完成。在普通PC機上的測試結果表明,Neo4j圖數(shù)據(jù)庫的查詢引擎能夠在一秒內(nèi)輕松遍歷百萬級的關系/邊。
 
 
 
 
知識圖譜賦能企業(yè)數(shù)字化轉(zhuǎn)型
 
 
 
 
 
 
 
作者:Neo4j大中華區(qū)總經(jīng)理方俊強
 
相互關聯(lián)是大數(shù)據(jù)時代的鮮明特征。激增且日益復雜的海量數(shù)據(jù)正通過各種方式對企業(yè)發(fā)展產(chǎn)生重要影響。如何正確理解和解讀數(shù)據(jù),發(fā)掘其內(nèi)在價值,從而推動企業(yè)的智能決策備受關注。
 
在當今的商業(yè)世界或者日常生活中,無論是企業(yè)還是個人都自覺或不自覺地使用知識圖譜,將解決問題的想法和過程相互關聯(lián)。知識圖譜技術可以讓其更加明確,為實現(xiàn)智能決策的數(shù)字化經(jīng)濟提供支持和保障。
 
知識圖譜是人工智能 (AI) 以及人類知識發(fā)展的基礎支柱之一,是對人、物、位置、事件和概念等實體的相互關聯(lián)世界的真實描述,為數(shù)據(jù)集成、管理和分析提供框架。
 
隨著關聯(lián)數(shù)據(jù)、人工智能以及數(shù)據(jù)分析日益發(fā)展,知識圖譜技術的應用不斷增加,成為各個行業(yè)業(yè)務的主流需求。IDC預測,全球 65%的GDP將實現(xiàn)數(shù)字化,2022年至2023年將推動超過6.8萬億美元的支出。而到2023年,亞太地區(qū)20%的商業(yè)智能將整合知識圖譜。
 
Neo4j知識圖譜尋找隱藏在復雜關聯(lián)事件中的模式,在更短的間隔內(nèi)以可擴展的方式從具有復雜上下文情景的大量數(shù)據(jù)中獲取有價值的信息,用戶可以對基礎數(shù)據(jù)進行推理并自信地使用其進行復雜的決策。
 
Neo4j知識圖譜將智能融入數(shù)據(jù),顯著提升整體價值,用例從管理遍布到分析乃至機器學習,使人工智能/機器學習獲得更好的預測,連接數(shù)據(jù)孤島,為數(shù)據(jù)結構和數(shù)字孿生等創(chuàng)新應用奠定基礎。
Neo4j知識圖譜的應用極其廣泛,覆蓋網(wǎng)絡安全、金融服務、醫(yī)療保健、生命科學、供應鏈和物流、零售、電信和制造等眾多行業(yè),適用于從欺詐檢測和實時推薦到患者旅程、數(shù)字孿生、材料清單等各種用例。以下將以網(wǎng)絡安全、醫(yī)療和電信行業(yè)為例做具體介紹。
 
整合網(wǎng)絡事件,強化網(wǎng)絡安全
亞太地區(qū),中國、澳大利亞和新加坡的聯(lián)邦及中央政府在網(wǎng)絡安全方面的支出處于領先地位。到2025年,他們在增強網(wǎng)絡安全的智能解決方案上的投資將超過7.24 億美元。
網(wǎng)絡世界正在快速發(fā)展,惡意軟件世界也是如此。IT和OT系統(tǒng)(數(shù)據(jù)庫、門戶網(wǎng)站、邊緣設備、操作系統(tǒng)等)可能受到潛在攻擊而發(fā)生異質(zhì)性變化,從而使網(wǎng)絡安全任務變得更加復雜。知識圖譜能夠整合網(wǎng)絡安全相關事件,并且可以通過機器學習方法進一步加以利用。
 
發(fā)現(xiàn)隱藏模式,支持個性醫(yī)療
臨床知識圖譜是一個開源平臺,包含大約2000萬個節(jié)點和2.2億個可用實驗數(shù)據(jù)、公共數(shù)據(jù)和文獻之間的關系。其規(guī)模不斷擴大,允許使用統(tǒng)計分析和機器學習來提高生物醫(yī)學研究的效率,例如生物標志物研究。知識圖譜加快了對生物標志物、個體基因和代謝過程之間關聯(lián)的探索,以支持個性化醫(yī)療的發(fā)展。
 
2020 年,中國長沙的醫(yī)院與四所中國大學合作,研究腫瘤生物標志物的藥物不良反應 (ADR)。知識圖譜應用于現(xiàn)有文獻,連接腫瘤、生物標志物、藥物和 ADR 之間的關聯(lián)。結果在臨床實驗中得到驗證,證實了比傳統(tǒng)的共現(xiàn)方法更好的模型性能,支持進一步?jīng)Q策。
 
智能電信網(wǎng)絡,應對復雜運營
亞太區(qū)的電信公司預計在2022年將花費超過5.84億美元用于網(wǎng)絡優(yōu)化和預防性維護。電信公司在越來越復雜的供應商生態(tài)系統(tǒng)中運營,服務必須跨各種硬件和環(huán)境進行交互。這給電信支持團隊帶來了重大問題,因為多供應商支持需要更高的能力來理解技術層之間的交互。
 
物聯(lián)網(wǎng)和邊緣設備的激增繼續(xù)在網(wǎng)絡拓撲中產(chǎn)生變化,使得進行故障診斷和實施基于規(guī)則的策略變得越來越困難。知識圖譜可以幫助電信公司捕獲和對流程、子網(wǎng)絡、設備和事件進行建模,以識別單點故障并支持SDN。
 
越來越多的公司將在數(shù)字優(yōu)先經(jīng)濟中面臨全新的挑戰(zhàn),需要以更大的敏捷性擴展解決方案流程。Neo4j知識圖譜是一個非常全面、豐富而且成熟的產(chǎn)品,包括負責數(shù)據(jù)存儲的Neo4j圖數(shù)據(jù)庫,致力數(shù)據(jù)分析的圖數(shù)據(jù)科學 (GDS) 以及負責數(shù)據(jù)挖掘和探索的數(shù)據(jù)可視化工具Neo4j Bloom。作為圖數(shù)據(jù)平臺的領導者,Neo4j的企業(yè)愿景就是在不同的行業(yè)場景,幫助客戶深入分析高度關聯(lián)的復雜數(shù)據(jù),使業(yè)務數(shù)據(jù)變?yōu)樯虡I(yè)智能,提高數(shù)據(jù)的應用價值,賦能企業(yè)智能決策和數(shù)字化轉(zhuǎn)型。
 
 
 
 
 

 

 

Neo4j CEO Emil Eifrem 解讀圖數(shù)據(jù)平臺引領數(shù)據(jù)庫未來十年的發(fā)展

 

 

(ChinaIT.com訊)萌芽于20世紀60年代的數(shù)據(jù)庫技術在剛剛興起的十年并沒有大行其道。而在過去短短的十年,信息世界快速發(fā)展,面臨極其復雜、互聯(lián)、動態(tài)、不斷變化的數(shù)據(jù)洪流,數(shù)據(jù)庫平臺如雨后春筍般涌現(xiàn),市場上的選擇增加到 350 多個。多年來,數(shù)據(jù)庫市場都以每年5 %至6%的速度高速擴張,市場體量未來4到5年有望從現(xiàn)在的500 億美元攀升至 1,000 億美元。
 
過去兩年,數(shù)據(jù)庫行業(yè)的發(fā)展趨勢呈現(xiàn)三大特征。
 
首先是融合,隨著新型數(shù)據(jù)的大規(guī)模創(chuàng)新,高速擴展的數(shù)據(jù)庫市場再次呈現(xiàn)出融合的局面,數(shù)百家數(shù)據(jù)庫廠商逐漸歸入到包括文檔數(shù)據(jù)庫、圖數(shù)據(jù)庫、時序數(shù)據(jù)庫、NewSQL數(shù)據(jù)庫在內(nèi)的四個全新且穩(wěn)定的數(shù)據(jù)庫陣營中。在不同細分領域中,僅有有限的幾家公司在領軍之路上引吭高歌,如圖領域的Neo4j 和文檔領域的 MongoDB。
 
第二,向云轉(zhuǎn)移成為整個行業(yè)的長期趨勢。2017年前后一些大型云供應商和獨立云供應商開始涌現(xiàn)。雖然曾因數(shù)據(jù)重力和監(jiān)管等因素的影響進展放緩,而今這一趨勢再次氣勢如虹。數(shù)據(jù)向云服務轉(zhuǎn)移在很大程度上成為數(shù)據(jù)庫平臺的發(fā)展驅(qū)動要素。
 
第三,數(shù)據(jù)科學家方興未艾。整體而言,數(shù)據(jù)科學家并不喜歡數(shù)據(jù)庫,他們更加鐘愛數(shù)據(jù)。而圖數(shù)據(jù)庫是個例外,越來越多的數(shù)據(jù)科學家對圖數(shù)據(jù)庫青睞有加。數(shù)據(jù)科學家使用圖形算法處理數(shù)據(jù),再通過圖將數(shù)據(jù)輸入機器學習管道中,從而為機器學習模型和預測提供關系型信號。由此,圖數(shù)據(jù)庫成為機器學習管道中的核心部分。
 
以供應鏈為例,10 年前供應鏈應用并不是圖數(shù)據(jù)庫的最佳用例。因為在當時任何生產(chǎn)實物產(chǎn)品的制造公司可能只擁有一個 2 到 3 個級別的供應鏈,關系型數(shù)據(jù)庫完全能滿足企業(yè)的需求。如果需要分析,加入2至3個節(jié)點即可。
時至今日,制造業(yè)企業(yè)不僅業(yè)務分布廣泛,橫跨不同大陸,而且還要應對此起彼伏的突發(fā)事件,制造業(yè)企業(yè)需要了解這種事件對供應鏈乃至業(yè)務產(chǎn)生的影響,擁有確保供應鏈安全的能力,行之有效的解決方案就是實現(xiàn)供應鏈數(shù)字化。如今,企業(yè)面臨的數(shù)據(jù)分析不再是 2至3次的跳轉(zhuǎn)挖掘,而是 20、30甚至40次跳轉(zhuǎn)挖掘。數(shù)據(jù)庫尤其是在多次跳轉(zhuǎn)方面表現(xiàn)卓越的圖數(shù)據(jù)庫成為必然之選。
 
不同于關系型數(shù)據(jù)庫,圖數(shù)據(jù)庫以事物的連接方式為中心,強調(diào)數(shù)據(jù)之間的關聯(lián)關系,它將數(shù)據(jù)間的聯(lián)系視為和數(shù)據(jù)本身同等重要。圖數(shù)據(jù)平臺讓用戶能夠在圖數(shù)據(jù)庫上開發(fā)和運行應用程序,它直接將關系和數(shù)據(jù)在物理層面上一并存儲下來,使得訪問數(shù)據(jù)結點和關系的操作能夠以線性時間復雜度完成。在普通PC機上的測試結果表明,Neo4j圖數(shù)據(jù)庫的查詢引擎能夠在一秒內(nèi)輕松遍歷百萬級的關系/邊。
 
未來十年,將是圖數(shù)據(jù)平臺成為主流并大放異彩的十年,這不僅引起了行業(yè)專家對圖技術的重新思考,對于開發(fā)人員而言也是一件幸事。開發(fā)者驅(qū)動是Neo4j的文化,Neo4j的成功離不開對開發(fā)者生態(tài)的建設。Neo4j重視對開發(fā)者的投資并致力為開發(fā)者服務,除了定期舉辦培訓、會議等各種活動,還出版大量相應的技術書籍,來輔助開發(fā)者不斷成長。
 
自2018年起Neo4j就活躍在中國市場。如今,Neo4j 的業(yè)務足跡遍布北京、上海和深圳并與業(yè)內(nèi)合作伙伴建立了良好的關系。今年6月,Neo4j在F輪風險投資中獲得3.25億美元的融資,創(chuàng)造了私營數(shù)據(jù)庫公司單筆最高融資紀錄,投后估值超過20億美元。除了繼續(xù)投資圖數(shù)據(jù)庫和數(shù)據(jù)科學外,Neo4j還將重點擴展中國市場,幫助越來越多的中國企業(yè)通過圖數(shù)據(jù)平臺來挖掘數(shù)據(jù)的價值。