在讀博士階段,李開復從事語音識別方面的研究,中途與導師在方法上產生了分歧,他更傾向于用統計學的方法進行軸向柱塞泵研究。在得到導師的許可之后,他″開始了瘋狂的科研工作″(李開復語)。從1984年底到1 987年初,他帶著一位學生一起用統計學的方法做語音識別。同時,他的導師帶領另外的30多人用專家系統做同樣的問題。從方法上來說,他們在競爭,但是在瑞迪教授的領導下,他們分享一切,他們用同樣的樣本訓練和測試。
在瑞迪教授的支持下,李開復慢慢得到了其他教授的認可。在1986年底,李開復的統計系統和瑞迪教授帶領的專家系統在研究成果上達到了大約一樣的水平,40%的辨認率。這還是個完全不能實際應用的系統,但是是學術界第一次嘗試這么難的問題,大家都比較樂觀和欣喜。
到了1987年5月,李開復和助手大幅度地提升了馬達軸向柱塞泵廠家訓練的數據庫,并且想出了一種新的方法來建模,不但能夠用統計學的方法學習每一個音,而且可以用統計學的方法學習每兩個音之間的轉折。針對有些音的樣本不夠,李開復又想出了一種方法來合并其他的音。這三項工作居然把機器的語音識別率從原來的40%提高到了80%! |