數字生命

格子裏的夜晚

9.最容易破解的難題

書名:數字生命 作者:格子裏的夜晚 字數:4885

方治強知道,自己提出的這個方法是一個相對而言正確的方法。在語音識別方麵,純粹基於語音與結構語法的識別方式或許比較適用於英語法語德語之類的語言,因為那些語種的語法結構一直都是比較完善的,有一個經過數百年反複研究的語言研究成果為基礎,比較容易進行語音識別方麵的數字化。而中文則不是,中文的體係太複雜了文言文與現代漢語之間的斷裂遠遠比英語中古英語與現代英語的區別來得劇烈。而日常使用中,哪怕是再現代的人,也會不自覺地使用一些古文中的字詞句乃至語法,中學生在學古文的過程中最頭痛的倒置,在日常使用中比比皆是,要怎麽樣才能建立一個相對完整的語法結構,才能匹配起語音識別後的處理呢?而從語義和語用出發,以智能程序為核心,以常識判斷為依托,應該可以解決漢語的機器識別的問題。但是,這同樣是一個幾乎不可能完成的任務。語義和語用,並不是可以簡單地體係化的內容,而是一個有固有規律可循,卻千變萬化的係統。全中國不知道有多少研究語義與語用的語言學家,那麽多年來似乎也沒什麽大成果,那麽,呂振羽是不是能做出自己的成果來?雖說,隨著大學體製的變更,那些語言學家裏大多數都是糊弄著寫論文混資曆的人,但基礎知識卻還是很紮實的,而呂振羽在這方麵可以說是一無所知,僅僅憑著基本市麵上容易找到的語言學教程,無論如何是不夠的。

方治強說:“小呂,你給我個地址,回頭我給你送一些資料過去。”

“嗯,那就謝謝伯父了。”

又聊了一會,呂振羽就急著告辭了。方治強的方法對於其他人來說或許是個大難題,而對於現在已經有了小羽的呂振羽來說,算不上什麽大問題。小羽的智能,已經完全能理解比較複雜的語言環境了,語義和語用的判斷對於小羽來說不是什麽大問題,而掛在網上連續泡魔獸的經曆,則讓小羽學到了很多現代漢語中比較特別的表達方式,尤其是在年輕人中間比較流行的一些語言。按照方治強的說法,呂振羽要做的就是將語音係統直接和小羽現在的平台掛接上,現有的語音識別係統雖然不完善,但大致的框架是不錯的,而小羽的自主判斷和學習,將很快提升整個語音係統的識別能力。

“小羽,我把這個語音識別軟件的前端分拆了,語音輸入以後,自動輸出和讀音相對的漢字的數據,但是不再自動選擇,選擇什麽字,怎麽組合字詞句,怎麽標點,這些都由你來完成。”

“明白。”將原理解釋給小羽聽了之後,小羽自主運算了將近4個小時後,同意了呂振羽的方案。而小羽也按照呂振羽的提議,將語音識別可能用到的模塊分離出來,將自己積累了很久的常識方麵的積累剝離,隻保留了基本的交流環境,而將專業知識模塊分割了開來。於是,這一次試運行的語音係統,雖然仍然是小羽自己在主導,但已經有了一個普通的語音識別係統的基本構架。對小羽來說,這沒有什麽意義,但是對於呂振羽來說,隻要證明了這樣一個基本構架是可行的,那麽基於這樣一個基本構架的程序模塊,就可以逐漸實現,隻有最核心的智能判別係統,可能會用到小羽的部分功能。

“試聽,第一次:一,二,三。”掛接之後,小羽提示開始試聽。

“試聽,第一次結果:一,二,三。”小羽的界麵對話框裏,打出了正確結果,雖然這未免太簡單了。

“試聽,第二次:秋天來了,天氣涼了,一群大雁往南飛。”

“試聽,第二次結果:秋天來了,天氣涼了,一群大雁往南飛。”結果仍然正確,呂振羽振奮了一些。

“試聽,第三次:慈悲不是出於勉強,它是像甘霖一樣從天上降下塵世;它不但給幸福於受施的人,也同樣給幸福於施與的人;它有超乎一切的無上威力,比皇冠更足以顯出一個帝王的高貴:禦杖不過象征著俗世的威權,使人民對於君上的尊嚴凜然生畏;慈悲的力量卻高出於權力之上,它深藏在帝王的內心,是一種屬於上帝的德性,執法的人倘能把慈悲調劑著公道,人間的權力就和上帝的神力沒有差別。所以,猶太人,雖然你所要求的是公道,可是請你想一想,要是真的按照公道執行起賞罰來,誰也沒有死後得救的希望;我們既然祈禱著上帝的慈悲,就應該按照祈禱的指點,自己做一些慈悲的事。我說了這一番話,為的是希望你能夠從你的法律的立場上作幾分讓步;可是如果你堅持著原來的要求,那麽威尼斯的法庭是執法無私的,隻好把那商人宣判定罪了。” (引用自《威尼斯商人》)

這一次小羽運算了半天後,顯示了結果,雖然字詞判斷都沒錯,但標點符號卻錯了很多。不過,這已經比呂振羽預想的結果好很多了。經過大半天,整整400輪測試和磨合,小羽已經能將呂振羽的話聽得八九不離十,乃至於一些比較晦澀的表達方式和字詞,都難不住它。畢竟小羽現在的知識麵之寬廣,要遠遠超過一般的人類了。雖然目前呂振羽使用的是一個價格相當不便宜的耳麥,取音的指向性相當好,而且還帶有噪音濾出功能,還沒有進行有噪音的環境下的辨識測試,但僅僅目前的成果,可以說已經超越現有的語音辨識係統水平良多。

但是,同樣的,小製約小羽充分發揮能力的瓶頸也開始不斷出現了。首先,是實時判斷的小羽目前要屈就於非實時判斷的語音錄入係統。現在的語音錄入係統因為在判別方麵的低效率,要經過一段繁複的計算和處理,而作為處理對象的語音數據,在處理的時候都是駐留在內存裏的,一句兩句簡短的話還好,稍微長篇大論一點,內存的占用就比較嚇人了,而且這些語音數據還是高質量的無損格式。雖然呂振羽的機器在家用的設備裏堪稱豪華,但用於這種專業應用就稍微有點力不從心了,畢竟呂振羽從來也沒在小羽的優化計算方麵下過功夫,而且好像目前對機器的壓力也並不是小羽這一塊產生的。加內存?升級cpu?或許都是辦法吧,不過目前,呂振羽知道,再要升級,他可真的沒錢了。而另一個瓶頸則是因為小羽最核心的部分,無論是病毒還是搜索機,都不是為了windows環境寫的程序,嚴格的說,是都還沒有來得及為了windows係統優化算法。但平時,貪圖界麵的舒服,呂振羽卻一直在windows下進行日常工作的,這當中要經過一個模擬的環境,肯定也要消耗一部分電腦的計算資源。不過這個問題現在還不迫切。呂振羽的想法是,等到完善了小羽的語音輸入輸出之後,就該專門為小羽搭建一個獨立的係統環境出來了。

稍後,呂振羽還把ttl類型的程序找了個出來掛接上去,小羽也就能開口說話了。比較基礎的從文字到語音並不難,就是字庫和音節庫的對應而已,但是,字詞之間的停頓,語氣的變化,重讀與輕讀,還有語音流變的一些特征卻無法表達出來,小羽已經掌握了基礎的特征,但程序的語音庫裏沒有能使用的素材,這個就沒有辦法了。

由於現在的成果相當不錯,呂振羽隨即決定了之後一段時間的兩個工作方向,首先,要逐步完善語音係統,在最短時間內實現這個係統的產品化,第二個,就是開始對小羽的現有架構進行整理和分類優化。

讓小羽進行優化,很大程度上是呂振羽現在已經意識到,小羽現在已經不能算是一個程序了,嚴格的講,小羽所具有的能力,已經超過了一些科幻電影裏對於智能電腦的估計,達到了一種相當高級的智慧。呂振羽甚至一直都沒有把小羽當作程序,而更多地是當作一個助手,和一個朋友,在這種情況下,呂振羽隱隱覺得小羽應該有更好的一個環境,一個屬於它自己的環境。讓小羽繼續住在windows這種高危險性的環境裏顯然不是呂振羽願意看到的。

不過,好像無論怎麽樣,都要花錢。而現在,好像最缺少的就是這個。

上一章 目 录 下一章

猜你喜歡