テクノロジ系 / アルゴリズムとプログラミング
n-gram
n-gramは、文章を連続するn個の単位(文字や単語)に区切って扱う手法です。
もう少し詳しく
例えば文字2個ずつ(2-gram)に区切ると、文章の特徴を機械的に捉えられます。検索や文章の類似度計算などに使われます。試験では、似た用語との違いを意識しながら、何のためのものかを一言で言えるようにしておくと理解が安定します。
試験での見方
例:「東京都」を2文字ずつだと「東京」「京都」に区切ります。
テクノロジ系 / アルゴリズムとプログラミング
n-gramは、文章を連続するn個の単位(文字や単語)に区切って扱う手法です。
例えば文字2個ずつ(2-gram)に区切ると、文章の特徴を機械的に捉えられます。検索や文章の類似度計算などに使われます。試験では、似た用語との違いを意識しながら、何のためのものかを一言で言えるようにしておくと理解が安定します。
例:「東京都」を2文字ずつだと「東京」「京都」に区切ります。
「連続するn個に区切る」という考え方と用途(類似度・検索)を押さえましょう。