本文へスキップ

テクノロジ系 / アルゴリズムとプログラミング

n-gram

n-gramは、文章を連続するn個の単位(文字や単語)に区切って扱う手法です。

もう少し詳しく

例えば文字2個ずつ(2-gram)に区切ると、文章の特徴を機械的に捉えられます。検索や文章の類似度計算などに使われます。試験では、似た用語との違いを意識しながら、何のためのものかを一言で言えるようにしておくと理解が安定します。

試験での見方

黒猫の闇の刻印

「連続するn個に区切る」という考え方と用途(類似度・検索)を押さえましょう。

例:「東京都」を2文字ずつだと「東京」「京都」に区切ります。

分類

テクノロジ系 / 基礎理論 / アルゴリズムとプログラミング

小分類:アルゴリズム

関連トピック:自然言語処理のアルゴリズム

情報の根拠

IPA FEシラバス Ver.9.2 の用語例をもとに、試験対策向けに独自解説しています。

関連用語

アルゴリズムとプログラミングの用語一覧へ