Tuesday, August 25, 2009

Automatic DIstillation of Structure(ADIOS)

所以簡單的說 Automatic DIstillation of Structure就是

1. 將每個sentence 變成Path(Node and Edge) à Graph

2. 計算每條Path每個node 的n-gram model path在全部graph分布的機率,n<j(全長-1)

3. 透過MEX 給定alpha and eta

4. 找出每個path 上最可能的pattern

5. 將最常見的pattern 做替換(需要考慮context-free 和context-sensitive 兩種狀況)

6. 重複1~5程序

這樣的優點是

不用annotation 一樣可以發現一些文法/規則

缺點也一樣伴隨著是

很多機率較高的部份不見得是有用的

0 Comments:

Post a Comment

<< Home