Archive for the '專業散文' Category

關於東華本《統計學》

Friday, February 9th, 2007

為何要寫?

  • 作者之一在退休後較有功夫
  • 覺得時下的統計學教本 ── 包括不少外國書 ── 其內容都和四十年前的沒有不同。

    意思是說:裡面的該淘汰的內容,因為別的課本也還有,都不敢拿掉;該加進去的內容,因為別的書沒有,也沒有加進來。

  • 目前多半的教本,都提到電腦計算。可是,講的都是用電腦算用手都算得出來的事物。電腦的用處,是拿來算不能用手算的。

    所以,這本書所講的電腦統計計算,很多是你大概用手在一小時或一天算不出來的。自七零年代以還,統計學最大的進步便是有效地和現代的資訊技術接軌,怎麼可以不教?


  • 這書的特點

    任何一個學門,如果還能在現代的科技社會裡立足,必需有一套完整的思路。不止是統計學如此,其它如物理、化學、生物等等,莫不如此。

    如果只是應付考試,最有效的辦法就是多做考古題。雖然等考試的效用一去(如考取了或者放棄不考了),過一陣就會忘掉。為了應付考試,我們也有一本和補習班名師合寫的統計學(鼎茂出版社:《統計學評論》)。

    如果你將來還想用到統計(例如初等應用:作圖列表,交叉分析之類;或者高級應用:建構模型,解釋現象,從而得到實務上或科學上的意義),那麼,你最好用「讀全本」的方式來「唸懂」。

    這本書給你的是初等的部分,並且也試著向高級的方向舖路。因此在講道理的地方一點也不馬虎。如果讀者還想更進一步,這本書應該能給你相當多的知識,讓你可以出發。

    統計是數據科學

    Sunday, September 5th, 2004
    這是我預備的十個演講之一, Power Point 的檔已經都有了,但轉成文章的不多。全文是 pdf 檔,可下載。

    萬物有常 世事多變

    Monday, February 2nd, 2004
    這是一篇描述「常態分布」的文章,是有一年應林共進教授的邀請而寫的。
    後來轉載在幾個地方,原稿略長,見所附的 pdf 檔。

    品味、執著和基本能力

    Thursday, April 4th, 2002
    這是我在 2002 四月十三日
    在高雄大學
    給資優生的閑話
    後來刊在《數學傳播》

    全文是長了點,請見所附的 pdf 檔

    大家一起來淘金

    Saturday, February 2nd, 2002

    每當有新名詞出現的時候,視趕流行的速度而異, 大家總喜歡把這個名詞搬弄出來。一方面,好像這玩意是萬靈藥( 例如:「資料採礦預測未來,洞悉環境掌握脈動」(品質月刊, 2002-4, 35-37));一方面,好像不談就不夠 up to date。 鬧哄一陣之後,除了後知後覺的一部份人還在提出來說, 大部分較聰明的就換另一個題目了。翻起月刊的 back issues , 你就會發現這些名詞(和它們的英文縮寫)就像走馬燈那樣, 像台灣的青春歌手,前一陣人氣鼎沸,過一會就連簽名會都沒有了。

      最近在台灣當紅的技術性名詞大概是data mining。這其實也不是那麼新的事, 大概是 1989 年之後才有的玩意罷,但廣告(短期課程)已有在說「 講員有二十年 data mining 經驗」的句子, 不知道要不要我們的消保官會採取甚麼動作?

       (more…)

    我所知道的一點 Data Mining

    Friday, February 2nd, 2001
    前言:Data Mining,光是看它的 data size,絕對是一頭大象。因此各家各派的對它的看法也就不同。因為各人摸到的是自己可以摸到的那一部分。兄弟雖然知道同時也極力呼籲 DM 應以實際有用為主,但基本上還是學院派。通常,學院派的人認為,如果一件事一定可以做成,那麼就不免無趣。幾十年前,我有一位朋友試著用海水提鍊鈾。因為那是用 ppm 來計算的,當然十分難。DM 有點像這類的工作,但是你不必只想造原子彈。提鍊錳、鉀、甚至淡水雖然無趣,但都頗有意義。這裡面的要點是效率。統計上所謂的大筆數據,和 DM 上所能見到的是不一樣的遊戲,因此雖然統計學者有明確的基本概念,但恐怕還是要因應變局,重新思考。反過來說,做 IT 的同仁,也不要一味相信背後邏輯不明的埋頭苦算會發現甚麼新大陸。總之,這算是新行業,大家各憑本事和運氣來博它一舖罷!

    今年十二月八號,我們在蠻辛苦的籌備之後,總算把 CDMS 成立了。這是一個以Data mining (DM)為專業的人民團體。在台灣恐怕是唯一的一個。DM是一個蠻當紅的專題。我們所面臨的第一個問題,便是不知道應該怎麼去翻譯這個名詞。硬譯為「資料挖掘」雖沒有大錯,但聽起來不夠高雅,也沒有學術的味道,連商業的氣味都不夠。一時之間因為實在想不出一個好詞,只好馬馬虎虎地用著,等誰有了好譯名再說。我們想的事是把這一群人集合一下,看大家有甚麼想法,或者,更要緊地,看大冢想幹些甚麼。

      甚麼叫 DM ? (more…)

    把春波都釀作一江春酎

    Tuesday, February 2nd, 1999

      電話八點鐘來,經過衛星的聲音 有些上氣不接下氣,但是相當職業化。「我是某某報的文教記者,」她說:「能不能向你採訪一下?」

      她有興趣採訪的東西,大概不是我想說的話。兩三個回合之後,她問:「你對於這個中央研究院統計研究所的期望怎樣?」

      「五年後大約能和一個美國的一流半的大學的統計研所比一比。」我老實說。

      她的反應應相當失望。 (more…)

    昔年種柳

    Tuesday, February 2nd, 1999

    今年(民國七十一年)七月一日,中央研究院正式成立了統計學籌備處。這件事情至少有兩種意義:第一:這是政府對於過去二十多年統計界同仁的貢獻的一種正式認可:統計學自理、工、農、商這些學院的羽翼下跳出來,開始與別的獨立科學如物理、化學、數學等分庭抗禮;第二:我們意識到國內的統計學方面的研究、發展、應用和推廣,還有許多路要走。我們應該研究什麼主題?發展那些系統?如何推展應用?怎麼將統計學所表現出來的近代的格物致知的方法,廣泛地深植到社會的思想形態裡?我們應該認真地開始回答這些問題,而統計所的成立,給我們一個機會。

    我想藉這篇文章,介紹一下統計學,國內的統計學以及我們想做的工作。

    (more…)

    孰謂鼠無牙?

    Wednesday, February 5th, 1975
    這是一篇介紹有關於電話通訊的一些研究工作的文章,多半是我昔日在貝爾實驗室所學到的。曾登在《科學月刊》,全文有一點長, pdf 檔在:

    Please click here