統合型知的学修支援システム(2)

概要

Doc2VecやBERTによる文書間の一致度(cos類似度)などを計算します。医療データサイエンス入門の課題としても利用しています。

BERTによる文書間の一致度の計算や単語の穴埋め

プログラムソース(Google  Colaboratory)

下記のリンクからプログラムを実行できます。

スクリーンショット

目的

自然言語処理(NLP)モデルであるBERT (Bidirectional Encoder Representations from Transformers)を用いて、日本語テキストのトークナイズ、文書間の類似度の計算、単語の位置関係の可視化、そして穴埋め問題を解く、などします。(医療データサイエンス入門の演習課題にもなっています

内容

Doc2Vecによる文書間の一致度(cos類似度)の計算

北海道医療大学 情報センター・情報推進課

お問い合わせ先:情報推進課 ips(at)hoku-iryo-u.ac.jp