文書解析システム100は、入力インターフェース110を介して取得した各アンケートデータに対して、評価表現を示す評価表現テキストと当該評価テキストが修飾する被修飾語テキストのセットをテキストセットとして抽出しつつ、評価表現テキスト、カテゴリ情報及び被修飾語テキストの出現頻度数に基づいて同義語を定義するようになっている。 A document analysis system 100, while extracting a set of an evaluation expression text indicating an evaluation expression, and a modified word text modified by the evaluation text as a text set from each of questionnaire data acquired via an input interface 110, defines a synonym based on the number of frequencies of appearance of the evaluation expression text, category information and the modified word text. - 特許庁
決定手段4は、句構造解析結果から、確実な係り受け関係の名詞以外の名詞を曖昧な係り受け関係の名詞とし、これらの名詞に対して、名詞辞書3に格納している出現頻度の値に基づいて修飾語・被修飾語を推定し、推定結果を出力する。 A determining means 4 regards nouns other than the nouns in the distinct modification relation as nouns in a vague modification relation, estimates modifying words and modified words for those nouns according to the values of the appearance frequencies in the noun dictionary 3, and outputs the estimation results. - 特許庁