央廣網(wǎng)北京7月7日消息(記者 馬可佳)拿起展臺上篆刻著形象豐富的甲骨文龜甲,打開高掃儀進行識別提取與翻譯:“單身狗”、“白富美”、“買它買它”,這樣一些流行網(wǎng)絡(luò)熱詞被識別翻譯出來,令人忍俊不禁。原來甲骨文也可以萌萌噠。這是本屆世界人工智能大會上,由智能文字識別領(lǐng)域頭部企業(yè)——合合信息所展示的熱門“黑科技”之一。

2021世界人工智能大會于7月8日-10日在上海世博展覽館召開。圖為合合信息的人工智能文字識別場景。
甲骨文背后的“智能文字識別”技術(shù)
甲骨文,最早出現(xiàn)于3400多年前的商朝。是中國發(fā)現(xiàn)最早的象形文字。當(dāng)時的王室貴族為了占卜和記事,將“文字”契刻在龜甲和獸骨上,圖案種類十分豐富,同時又透露著古代文化的神秘。由甲骨文引發(fā)對中國古文字的破解,對中國考古學(xué)具有劃時代的意義。如今,合合信息借助AI技術(shù),用數(shù)字化的方式嘗試破解更多甲骨文背后的世界。
“這一技術(shù)我們還處于內(nèi)測階段,也是首次在人工智能大會上展示!蔽挥谏虾J啦┱褂[館H1館A1024展臺的合合信息相關(guān)負責(zé)人告訴記者,甲骨文作為珍貴文物,曾與漢晉木簡、敦煌文書、明清檔案一起被譽為中國近代學(xué)術(shù)史的“四大發(fā)現(xiàn)”,此次合合信息專為甲骨文識別開發(fā)了新的系統(tǒng),通過大量數(shù)據(jù)的生產(chǎn)識別、圖像聚類和主動學(xué)習(xí)等一系列技術(shù)算法,對甲骨文字進行檢測與識別并翻譯成現(xiàn)代漢字,不僅將甲骨文研究資料電子化、數(shù)據(jù)化,也拉近了年輕人與中華文化的距離。
識別甲骨文,僅是合合信息對于智能文字識別領(lǐng)域一個分支的嘗試性探索。此負責(zé)人表示,上海世界人工智能大會(WAIC)已經(jīng)成功舉辦三屆,今年合合信息緊扣大會方向,以“AI讀懂文字信息”為主題,將在大會期間向外界展示公司在人工智能領(lǐng)域的更多研究新成果。

人工智能是上海落實國家戰(zhàn)略部署、重點發(fā)展的三大先導(dǎo)產(chǎn)業(yè)之一,在這片沃土上,近年來人工智能領(lǐng)域出現(xiàn)了許多創(chuàng)新場景和前沿進展。合合信息作為上海本土科技企業(yè)代表,2019和2020年成功在世界人工智能大會舉辦金融科技落地論壇,并先后邀請兩位諾貝爾獎獲得者參與發(fā)言。
據(jù)了解,當(dāng)前合合信息的智能文字識別技術(shù),支持中、英、俄等56種語言的文檔圖像、100+種證件的快讀智能分類,以及全球不同國家、不同行業(yè)的卡證、票據(jù)、定制識別等多個AI場景的產(chǎn)品和解決方案。全球累計用戶下載量超23億,合作企業(yè)已經(jīng)遍布各行各業(yè)。
能落地的黑科技,才是硬科技
讓黑科技落地,才是技術(shù)的精髓。“無論多么炫酷的黑科技,能真實服務(wù)我們生活的都是硬科技,比如名片錄入,原來錄一張名片要花上幾分鐘,現(xiàn)在幾秒鐘就可以,這是個數(shù)量級的變化,能帶來10倍的好處才能吸引客戶!焙虾闲畔相關(guān)負責(zé)人這樣解釋。
他所說的正是合合信息2006年開發(fā)的一款產(chǎn)品——名片全能王。這是一款智能名片及人脈管理工具,可將復(fù)雜場景下的紙質(zhì)名片一秒讀懂,字符識別率平均值達99.43%。同時升級版本如數(shù)字名片,能夠多語言精準識別、一秒保存到手機,是用戶人脈智能管理的一個“利器”。這款產(chǎn)品也為合合信息打開了美國、日本、印度等全球市場。
“掃描全能王”是合合信息全球用戶最多的一款產(chǎn)品。它不僅集文件掃描、證件掃描、圖片文字提取識別、PDF 內(nèi)容編輯、電子簽名等功能于一體,也是一款非常實用的隨身掃描儀,移動的文件資源庫。這款產(chǎn)品在 Apple Store 125 個國家和地區(qū)效率類免費應(yīng)用總下載量排名第一。
不得不提的還有“啟信寶”,合合信息啟信寶是2015年上線的一款基于合合商業(yè)大數(shù)據(jù)平臺的企業(yè)信息查詢APP,主要為泛金融、泛法務(wù)、泛商務(wù)、政務(wù)等行業(yè)的職場用人群,提供企業(yè)查詢、商業(yè)盡調(diào)、風(fēng)險合規(guī)、營銷拓客、企業(yè)服務(wù)等場景下的數(shù)據(jù)服務(wù)。
除了以上三款C端產(chǎn)品,合合信息基于文字識別加大數(shù)據(jù)衍生出的“數(shù)字客商平臺”、“企業(yè)智能解決方案”,也積極為企業(yè)降本增效,資產(chǎn)數(shù)字化升級提供賦能,更多應(yīng)用場景實現(xiàn)落地。
以客戶關(guān)系管理場景為例,合合信息為德國軟件公司SAP提供供應(yīng)商智能風(fēng)控、財務(wù)進銷項應(yīng)收應(yīng)付以及費控管理等場景助力企業(yè)數(shù)字化升級。集成合合信息CamCard名片識別功能的SAP C/4HANA具備“快、準、多、全、實時”等五大特點,為企業(yè)解決了海量名片快速識別,幫助業(yè)務(wù)人員快速把名片上的信息保存成SAP賬戶管理系統(tǒng)中的線索。數(shù)據(jù)顯示,使用該系統(tǒng)后名片錄入時間可以從3天減少至15分鐘,相關(guān)業(yè)務(wù)部門可以100%擺脫手工錄入,人力成本節(jié)約57%。
斬獲ICPR2020大賽11項冠軍,“看不見的”技術(shù)軟實力
“看得見的王者,看不見的力量”。一家企業(yè)背后“看不見的”技術(shù)力量是決定王者風(fēng)范的真正要素。
作為智能文字識別領(lǐng)軍企業(yè),看起來平平無奇的智能識別技術(shù),背后是獲得過國際級大獎的技術(shù)團隊。合合信息的創(chuàng)始團隊都是技術(shù)出身,從而建立起技術(shù)先發(fā)優(yōu)勢。在合合信息的人才架構(gòu)中有一個博士團隊:負責(zé)未來3-5年科技的發(fā)展趨勢,確保在技術(shù)上的領(lǐng)先性和前瞻性。
這支團隊在2020年舉辦的國際模式識別大會(ICPR2020)上,被譽為“冠軍收割機”。曾聯(lián)合華南理工大學(xué)、聯(lián)想研究院共同組隊,斬獲了所有七個賽道14個子任務(wù)中的11個冠軍。據(jù)公開資料,合合信息目前擁有100余項世界領(lǐng)先、自主知識產(chǎn)權(quán)的發(fā)明專利,境外專利超30項,是Google Top Developer全球頂尖開發(fā)者。

值得關(guān)注的是,展會上合合信息另一大產(chǎn)品亮點也吸引很多人關(guān)注。現(xiàn)場,合合信息還向外界發(fā)布了“數(shù)字政務(wù)大腦”,基于其商業(yè)大數(shù)據(jù)平臺,對全量企業(yè)、全產(chǎn)業(yè)鏈和區(qū)域經(jīng)濟進行多維度政企數(shù)據(jù)融合、分析、挖掘。對協(xié)助政府部門精準招商,實時了解區(qū)域經(jīng)濟動態(tài)和企業(yè)信息,輔助政務(wù)部門從被動了解消息到主動管理服務(wù)具有重要意義。
幫助政府和更多的企業(yè)整理、轉(zhuǎn)化數(shù)字資產(chǎn),正是合合信息下一步的發(fā)展思路。毫無疑問,合合信息通過“AI+大數(shù)據(jù)”為商業(yè)數(shù)據(jù)和現(xiàn)代企業(yè)賦能,在智能文字識別領(lǐng)域?qū)⒗^續(xù)領(lǐng)跑,未來發(fā)展前景不容小覷。