Automatic DIstillation of Structure(ADIOS)
所以簡單的說 Automatic DIstillation of Structure就是
1. 將每個sentence 變成Path(Node and Edge) à Graph
2. 計算每條Path每個node 的n-gram model path在全部graph分布的機率,n<j(全長-1)
3. 透過MEX 給定alpha and eta
4. 找出每個path 上最可能的pattern
5. 將最常見的pattern 做替換(需要考慮context-free 和context-sensitive 兩種狀況)
6. 重複1~5程序
這樣的優點是
不用annotation 一樣可以發現一些文法/規則
缺點也一樣伴隨著是
很多機率較高的部份不見得是有用的
0 Comments:
Post a Comment
<< Home