140 likes | 508 Vues
自然語言處理與應用 期中報告. 授課老師 : 顏國郎 教授 學生: 陳雅琪 MA0G0219 鄭冠瑀 MA0G0225. Entropy 的公式. ㄧ般計算公式 :. 子音 + 母音的計算公式 :. 簡介. 計算注音的 Entropy 。 假設注音是子音接母音的型式。 子音接母音的型式為 408 種。. 計算注音符號. 注音符號 : 總共有 37 個 ◎子音 : ㄅㄆㄇㄈㄉㄊㄋㄌㄍㄎㄏㄐㄑㄒ ㄓㄔㄕㄖㄗㄘㄙ ( 有 21 個 ) ◎母音 : ㄚㄛㄜㄝㄞㄟㄠㄡㄢㄣㄥㄦ一ㄨ
E N D
自然語言處理與應用期中報告 授課老師:顏國郎 教授 學生:陳雅琪 MA0G0219 鄭冠瑀 MA0G0225
Entropy的公式 ㄧ般計算公式: 子音+母音的計算公式:
簡介 • 計算注音的Entropy。 • 假設注音是子音接母音的型式。 • 子音接母音的型式為408種。
計算注音符號 • 注音符號 : 總共有37個 ◎子音:ㄅㄆㄇㄈㄉㄊㄋㄌㄍㄎㄏㄐㄑㄒ ㄓㄔㄕㄖㄗㄘㄙ (有21個) ◎母音:ㄚㄛㄜㄝㄞㄟㄠㄡㄢㄣㄥㄦ一ㄨ ㄩ (有16個) ◎雙母音:一ㄢ、一ㄥ、ㄨㄚ、ㄨㄛ、ㄨㄥ ㄚㄛㄜ……(有38個)
計算注音符號Entropy(1/2) • 計算機率 1.個別出現次數/總出現次數=個別機率 2.機率P=1/37 • Entropy計算結果
計算已知注音是子音接母音型式的Entropy(1/4) • 二個音的所構成的注音符號Entropy 1.假設每個音出現機率為古典機率 2.不考慮雙母音(子音+母音) 3.使用 ㄦㄢㄞㄚㄗㄓㄧㄣㄛㄘㄔㄨㄤ ㄠㄜㄙㄕㄩㄡ 共19個為母音 4.2479bits
計算已知注音是子音接母音型式的Entropy(3/4) • 二個音的所構成的注音符號Entropy 1.假設每個音出現機率為古典機率 2.考慮雙母音 = =7.4963
計算注音是子音接母音型式只有408種的Entropy(1/3)計算注音是子音接母音型式只有408種的Entropy(1/3) • 子音接母音的組合數有x=408個 • 和Phone.txt比對的機率=P(x) 7.694bits
計算注音是子音接母音型式只有408種的Entropy(2/3)計算注音是子音接母音型式只有408種的Entropy(2/3) 子音
計算注音是子音接母音型式只有408種的Entropy(3/3)計算注音是子音接母音型式只有408種的Entropy(3/3)