top of page

SEARCH BY TAGS: 

RECENT POSTS: 

FOLLOW ME:

  • Facebook Clean Grey
  • Twitter Clean Grey
  • Instagram Clean Grey
搜尋

 Word Embedding

  • 作家相片: 士益 黃
    士益 黃
  • 2016年11月16日
  • 讀畢需時 1 分鐘

Word Embedding則是利用另外一種方法來找出文章中的關鍵字詞,由於中文字無法進行直接運算,而將文章中的字詞投射在向量上,以數學的方式來表示,是一種低維度向量形式的單詞表示,能夠代表單詞的部分語意及含義。再把算出結果相近之字詞提出,就可以找到許多具有類似意義的詞彙,藉此來改進專利品質分析的結果。

  例如:對於任意兩個已經用Word Embedding形式表示的單詞,我們可以簡單通過計算兩個向量之間的cnosole相似x,就得出兩個單詞辭義接近程度,比如通過計算可以得知如下單詞的語意相似x:

  • 台灣”,WE”香港”)=0.79

  • 林志玲”,WE”舒淇”)=0.93

  於是乎,對於輸入的句子的某個單詞,我們可以從所有其他單詞中找出和這個單詞語意最接近的一部分單詞,也就是Cosine得分最高的一批單詞。


 
 
 

最新文章

查看全部
暑期自我評估及心得感想

在暑假中其實只有短短兩個月,而我不僅要到實驗室,也得同時面對校外打工來賺取自己生活費的壓力,但在實驗室中,學長姊都很有耐心的願意一次一次重新教我,及時有時我反應較慢,但還好我都還是可以在時間內完成該做玩的工作,兩個月說多不多,說長不長,也僅僅能夠接觸到文字探勘的皮毛而已,開...

 
 
 

Comments


© 2023 by Closet Confidential. Proudly created with Wix.com

bottom of page