Monday, December 07, 2009

貝多分???

這兩天透過做了一個模擬

模擬一: 你能夠將字典的結構和關聯全部背下來

模擬二: 你能背下越多的字和與其他字的搭配

結果是

1. 分別在6000, 20000, 50000, 100000, 200000,字下

   效果最好的是在20000~500005中間

   這個告訴我們一件事,背的越多不見得越好

   而是應該被該背的

Sunday, December 06, 2009

實驗

我有幾個朋友間接地在推廣不同學英文的方式,George, Turney…

所以我將他們的方法嘗試透過電腦模擬及考試來看結果

George 發現透過辭典來學英文(在此,我比較喜歡用有結構和關聯性地學習文字)

Peter Turney 教授則是透過PMI /collocation 來觀察,其發現,記住字與字的關聯/搭配能對語言學習有很大幫助(這也被很多國內學者驗證)

還有另一派的人則不斷歸納公式,例如在IR上最常出現關於edit distance 相關的方法

 

因此,看來都很有道理

我就將其作實驗

實驗一

改變corpus size 看PMI /Collocation 的有效性

實驗二

改變wordlist 來看效果

於是,我窮蒐網路,從Academic word list/570 words, General Service List/2284 words, BNC corpus/6318 words,….一路驗證到234936 words

實驗三

幾個方法的比較

Dictionary, Collocation, Edit Distance, …

 

最後得出來結果

1. Corpus 越大,collocation 的結果越穩定,但到了一個量後,再大的corpus 並無法改變甚麼(這其實很值得討論)

2. 字需要被一定的數量,但也不要太多(太多反而會讓自己混淆,不是很有趣嗎? )

3. 人無法用一個方法滿足所有問題,我們必須宗和各種方法來培養自己的語感,最後基於經驗做出判斷

Thursday, November 26, 2009

兒子的創作

 

題目:你

你是我的好朋友,
你是未來的我,
你是我的頭腦,
你是我的支撐點,也是我的抗力點,
你是我的成長過程,
你是我!


 

相信嗎?這是一個7歲小孩的作品

我兒Perry

Thursday, September 10, 2009

爭端

突然有一種領悟,似乎大多數爭端/抱怨的來源都是因為我們僅站在自己的立場在想事情

Monday, September 07, 2009

lively event

對lively event 的支持

 

adopted from  http://moonstop.pixnet.net/blog/post/21655583

一、 對於Michel de Certeau幾點論述的整理
Michel de Certeau 以「The practice of everyday life」為題,一開始便先界定他論述中幾個需要釐清的概念:誰的日常生活?怎麼樣算是實踐?實踐了以後又有什麼效果?
大眾的日常生活實踐
一般的社會大眾,市井小民,在社會中佔有絕對多數的位置,卻在政治權力的場域裡成為少數甚至微不足道的集合名詞。但是,身在被統治的位置,不代表他們無法掌握自身的主動性,也不只是被動的接受統治權力及強勢文化,其實不論是日常的談話、閱讀、移動、逛街、烹飪都是日常生活實踐的一種,也具備策略(tactic)的特徵,而能展現他們能動性的證據之一,就是消費。消費者透過對物質使用的實踐-生產機制將物質傾銷給每一個人-不會形成一個尋常的,適切的慣例,消費者會有個人性的主觀思考和選擇,而進行狡猾的‘移動 ’(movement),也就是‘想做’(making do)。
消費的生產意義
當產品從生產工廠放置到商業櫥窗後,產品已經不再是原本本質上屬於的種類,更包含了複雜的多層意義,其中之一的呈現方式,就是透過消費,所謂的再次生產(another production)來展現。雖然消費行為處處皆是,這層生產關係卻不是那麼顯而易見,因為消費所意涵的生產並不是透過產品本質,而是透過對產品的使用去展現面對統治者經濟秩序的方式。例如印度人面對西班牙殖民者強勢政權所帶來的文化霸權時,既無法拒絕也無力抵抗,但在接受且使用異文化的同時,統治者經濟秩序裡頭的權力卻會轉向至使用者/消費者/被殖民者中,儘管使用者/消費者/被殖民者並無挑戰的內在意圖,但他們卻成功的逃逸出殖民者同化的政策,人在心不在。而這個相似的矛盾性也存在於社會裡,透過能散佈及接收文化—精英階層製造的語言—的一般社會大眾。
實踐的方式
首先,消費者的行為模式和自閉兒童所畫的漫遊線有幾分相像:迂迴、有違常規的軌跡,完全是按照自己的邏輯行事,儘管他們所漫遊的空間已被建構、書寫、形式化、充滿了被設立的語言詞彙(電視、報紙、超級市場和博物館等等)以及受到規範而規格化的語法形式,但他們漫遊的軌道,遺留了消費者興趣和慾望的軌跡,雖不是基進的意志驅使著行為,但也不意味著他們身處的社會系統能完全掌握住他們的行蹤。
戰略(strategy)和策略(tactic)
軌道是有計畫性的移動,兩種清楚分野的行進方式被稱為戰略(strategy)和策略(tactic)。
戰略是和權力關係緊密相連,因此這些具有權力和意志的主體能在環境(environment)中運用自如(如老闆、公司、科學機構等)。場域 (place)被規範在確切(proper)中,並以此規範和外部具有權力的政治、經濟、科學產生關係,戰略的模式就是在如此被建構的場域中運行。所謂的適切,就是能操縱運用時間的自主場域。
戰略在自身的適切場域和機構所築成的堡壘之中擁有力量,他們和其力量的連結卻隱藏在客觀的計畫之中。
而策略(tactic)則是無法被放置在適切的場域,整體中和他者無法畫出一條清楚的界線。策略的場域就是他人的場域,策略的空間就是他人的空間,它使自己以零碎的模樣悄然潛入他人的場域中,並不為了奪取他人場域以成為自己整體的一部分,也不分野。策略正因沒有屬於自己的外在權力資本化空間,因此策略軌跡的蔓延依附環境,策劃拓展及維護自主性卻不消解它對環境的承認及尊重。它不意圖顛覆環境。上述的‘適切’是空間戰勝時間,是場域內部的運作關係。而正因為策略沒有自己的場域,更不可能有適切的空間存在,所以它依賴的是時間-它總是在注視著機會,而機會必定是在隱密的側邊被捕捉。而且策略並不是一條恆常維持在那的線,因為它不為了讓事件轉換成機會而去操縱事件,而是不確定性的移動。弱勢(weak)只能不停的轉換自己,最後權力就會遠離他們,或是根本沒有靠近過。當策略可以組合駁雜的元素(例如家庭主婦一日瑣碎的家務)成為一種決定而不是精英思想的論述形式,行動和方法在這有利的時刻裡就成功的捕捉到機會了。
策略並不是一條清楚的軌道在運行,所謂清楚的軌道不如說是國家機器運作的路線,而策略正是提供身處這龐大系統下的消費者一個逃逸的管道,不是離開這個場域,而是使用更迂迴的方式達到自主意識驅使的渴望和興致。
總結以上,戰略和策略的差別在於:
一、 戰略是對權力關係的操縱和掌握,主體的意志和權力因此而能獨立於環境之外。策略則是權力軌跡的缺席。
二、 戰略擁有自己的適切場域,策略沒有屬於自己的場域空間,策略因此而具流動性,不確定性,隨時觀察機會和有利的時刻。
三、 戰略藉由場域的建立來抵抗時間的侵蝕作用,而策略正是聰明的利用時間和機會和扮演,將自己安置在權力的基層裡。

Tuesday, September 01, 2009

受寵的台北小孩

星期一請假陪小孩去小學,發現嘿嘿幾乎每一斑的家長幾乎都是一樣

星期二走到鄉間,卻發現鮮少家長送小孩,全程陪同

這反映了台北小孩比較受寵? 還是都市家長比較放不下心? 還是都市比較混亂和令人擔心?

Tuesday, August 25, 2009

Automatic DIstillation of Structure(ADIOS)

所以簡單的說 Automatic DIstillation of Structure就是

1. 將每個sentence 變成Path(Node and Edge) à Graph

2. 計算每條Path每個node 的n-gram model path在全部graph分布的機率,n<j(全長-1)

3. 透過MEX 給定alpha and eta

4. 找出每個path 上最可能的pattern

5. 將最常見的pattern 做替換(需要考慮context-free 和context-sensitive 兩種狀況)

6. 重複1~5程序

這樣的優點是

不用annotation 一樣可以發現一些文法/規則

缺點也一樣伴隨著是

很多機率較高的部份不見得是有用的

語感-2

然而,語感(Language Intuition/language sense?)

語感(language sense)應是言語(parole)到意念(meaning)的邏輯轉換(logic transfer)的能力,換句話說是一種語言能力的綜合素質的反映。

實際上語彙(vocabulary)和語篇(text)之間存在一個很大的障礙(gap),它們之間絕無平路,而是一個深淵,從語彙達到語篇只能飛躍(fly over)過去, 這種飛躍的助力就是語感。

http://eng.hzu.edu.cn/yugan/ShowArticle.asp?ArticleID=12

《朗文當代英語辭典》對intuition的解釋是“the ability to understand or know something because of a feeling rather than by considering the facts”(對某一事物有所理解或有所知的能力,這一能力依靠的是感覺而非考慮事實)。該詞典解釋intuitive的時候說:“an intuitive idea is based on a feeling rather than on knowledge or facts.”(直覺的念頭,以感覺而非以知識或事實為基礎。)可見intuition是直覺,intuitive是直覺性的。“語感”屬於 intuition,在性質上是“intuitive”。“intuition”可以用來指對事物的直覺,如“My intuition told me it is not true”,也用來指語言方面的直覺(即語感)。在(語言的)某一方面的直覺用“intuition about...”,著名語言學家喬姆斯基(Chomsky)在他的代表作《句法結構》(英文版)裏就用了“intuition about linguistic form”(對語言結構的直覺)、“intuition about meaning”(對意義的直覺)等短語。

在英語語言學術語中,可以直接用“intuition”表示“語感”。《牛津語言學詞典》英文版對“intuition”的釋義首先就是 “the intuitive grasp that people have or may have of the structure of their own language”(人們對他們自己的語言結構所具有的或可能具有的直覺性把握)。這就是語感。

http://qkzz.net/magazine/7532-6200/2007/02/2167274.htm

 

 

所以,一個深深的疑問對我這樣希望利用電腦來促進語言教育的人

我必須去想的是如何協助學習者培養語感

1. 自動越讀報紙?

2. 改錯練習?

3. 組字練習?

看到一個演講的警惕/不要嘗試無所不知,否則你將一無所知

看到一個大陸大學校長的演講,讓我深自警惕

 

不要企圖無所不知,否則你將一無所知。企圖無所不能的人最終是一無所能。企圖無所不專的人終將一無所專。就算有十個百分十還需一個百分百,即使千招會還得要一招熟。因此,書籍好比食品。有些只須淺嘗,有些可以吞咽。只有少數需要仔細咀嚼,慢慢品味。 正所謂,不塞不流,不止不行。

有夢想誰都了不起,有勇氣就會有奇跡。