未來智能交互核心,人工智能的主戰場——語義識別如今發展如何?
什么是語義識別
語義識別可以分為三層:
1.應用層:
包括行業應用和智能語音交互系統/技術應用。
2.NLP技術層:
包括以語言學、計算機語言等學科為背景的,對自然語言進行詞語解析、信息抽取、時間因果、情緒判斷等等技術處理,最終達到讓計算機懂人類的語言的自然語言認知,以及把計算機數據轉化為自然語言的自然語言生成。
a)詞語解析與信息抽取:包括分詞、詞性標注、命名實體識別和詞義消歧,從給定文本中抽取重要的信息。
b)句法解析與語篇理解:對篇章結構的一系列連續的子句、句子和語段間一定層次結構和語義關系的分析,包括時間、事件、因果關系等,甚至于文本所攜帶的情緒識別。
c)自然語言生成:從結構化數據中以可讀地方式自動生成文本的過程。包括三個階段:文本規劃(完成結構化數據中基礎內容的規劃)、語句規劃(從結構化數據中組合語句,來表達信息流)、實現(產生語法通順的語句來表達文)。
3.底層數據層:詞典、數據集、語料庫、知識圖譜,以及外部世界常識性知識等都是語義識別算法模型的基礎。
語言本身詞性、詞性、詞義、表意、組成邏輯復雜等性質,決定了語義識別的難度。因而語義識別技術也涉及語言學、計算機語言、數學、統計學、哲學、生物學等諸多廣泛的學科支撐:
a)音韻學:指代語言中發音的系統化組織。
b)詞態學:研究單詞構成以及相互之間的關系。
c)句法學:給定文本的哪部分是語法正確的
d)語義學:給定文本的含義是什么?
e)語用學:文本的目的是什么?
語義識別應用場景
語義識別技術可以分析網頁、文件、郵件、音頻、論壇、社交媒體中的大量數據,應用領域廣泛,既可以直接應用于醫療、教育、金融等行業。也可以通過技術接口應用于所有智能語音交互場景,如智能家居、車載語音、可穿戴設備、VR、機器人等,從交互的方式上,也可以分為:事實問答、知識檢索、分類問題等。智能語音交互被看做未來人工智能技術中最值得期待的應用場景。
1)醫療+:
電子病例系統:為醫療專業人士提供實時語音聽寫、電子病歷錄入等。
智能問診/輔助診斷:直接服務于C端用戶或者醫療專業人士,通過對癥狀的描述,關鍵詞查詢,進行病癥的初步判斷,分類科室、輔助診斷等。
數據庫查詢:為臨床專業人士提供語音導航、相關論文、文獻資料庫檢索查詢等。
2)教育+:
口語測評:基于自然語言處理技術進行口語能力的測評。
自適應學習:通過人工智能技術,題庫系統,以及算法模型,根據學生在測試中對上一道問題的回答情況,自動調整學生接下來所需回答問題的難度和順序,以達到讓每一個學生擁有最合適的學習方案。
教育機器人:以激發學生學習興趣、培養學生綜合能力為目標的機器人硬件產品,以及智能教育系統。
3)金融+:
自動報告生成:將公司年報、招股書、行業新聞、法律公告等結構化和非結構化的信息、數據進行處理,并且結構化生成報告,服務于投資銀行,證券研究機構。
風控/征信:通過爬去個人及企業在其主頁、社交媒體、新聞中的文本,分析、預測、判斷其投資風險點。
量化交易:運用自然語言處理,深度學習(DeepLearning)等多種AI技術,進行量化交易模型的建立。
智能投顧:以更強大的計算機模型運用人工智能的技術對大量客戶進行財富畫像,為客戶量身定制的資產管理投資方案。
潛在客戶挖掘/定制化保險。
4)法律+:
智能法律檢索:對數字化法律文本、裁判文書等法律資料的檢索。
自動審閱:對法律文件、合同等文件進行審查、分析和研究,進行調查取證、盡職調查、合規審查、電子取證等。
智能文書起草:人工智能系統將可能起草大部分的交易文件和法律文件甚至起訴書、備忘錄和判決書,律師的角色將從起草者變成審校者。
在線法律服務/法律機器人:直接向終端用戶提供一般法律咨詢服務,比如遺囑、婚姻咨詢、交通事故咨詢等。
5)新聞/文獻+:
從新聞素材采集、智能編輯、自動寫作、自動化文摘生成,到新聞的智能分發,語音/語義識別、AI翻譯等技術正在全面的進行新聞傳播行業。根據騰訊研究院計算,過去8年,新聞業收入減少了1/3,就業崗位減少了1.7萬個。
6)智能商業+:
智能/虛擬客服:基于系統數據庫、知識圖譜,在與客戶的對話中,獲取客戶需求,并提供相應的答案來解決客戶的問題。
輿情監控:通過對互聯網的海量信息自動抓取、分類聚類、主題檢測、專題聚焦、實現對網絡輿情監測和新聞專題追蹤等,并能形成分析報告,提出應對策略。
數據挖掘/智能營銷:人工智能技術處理技術對于用戶在互聯網上留下的大量個人信息、登錄信息、路徑關系、社交關系、消費記錄等數據有極高的處理效率,通過各種算法模型,達到數據挖掘,用戶精準需求分析,m.twshmhelmet.com,自動化營銷等目的。
7)翻譯+:
基于深度學習技術的神經翻譯技術(NMT),相比較于規則法(RBMT)、統計法(SMT)兩種機器翻譯方法,KUKA機器人示教器維修,最大的優點在于1.不在需要人為的去抽取特征;2.不需要進行詞語切分、詞語對齊、句法樹設計等復雜的設計工作,而隨著樣本庫的擴充和訓練量的增加,其翻譯能力得到正向提升。
未來,基于深度學習的翻譯技術將更多的應用在會話、同聲翻譯、文本翻譯等多種場景。
語義識別環境背景分析
語音識別、語義識別是自然語言處理最重要的兩項技術,且聯系緊密,在上述語義識別的廣泛應用場景中,常常是語音、語義相互嵌套,共同作用的結果,大多數研究語義識別的公司也涉及到語音識別技術的研究,因而下述的分析中,涉及數據方面,我們更多的是放在自然語言處理層面來討論的。
自然語言處理作為一項重要的人工智能技術之一,成為2017年最炙手可熱的領域,在整體上離不開政策上的支持,技術上的進展,市場應用的極高價值,資本投資等多方面的共同作用。
政策層面:政策引導是語義識別增長的外在驅動
人工智能作為國家戰略發展規劃之一,足見其重要性,在這個政策的綱領下,國家型自然科學基金、產業基金、地方政府財稅優惠政策、人工智能相關實驗室、科技產業園區等切實促進人工智能的發展落地,為自動駕駛、計算機視覺、語音/語義識別創業提供了更好的條件和基礎設施。
經濟層面:經濟價值是語義識別發展的燃料
一方面,自然語言處理應用場景廣泛,市場潛力和經濟價值巨大,GlobalMarketInsights的數據顯示,2017-2024這七年,智能語音交互的全球市場,每年增長率將達到34.9%。據估算,2024年的全球市場規模,將達到720億元。
另一方面,國內資本對于自然語言處理的投入也相當巨大,根據鯨準App數據統計,截止目前,KUKA機器人維修,自然語言處理已披露融資總額累計超54億元。