Text feature amount extraction device, text feature amount extraction method, and program

テキスト特徴量抽出装置、テキスト特徴量抽出方法、およびプログラム

Abstract

【課題】テキストで表記された文章の特徴量を決定するテキスト特徴量抽出装置において、日本語に対応し、入力されたテキストの発話意図を推定するテキスト特徴量抽出装置、テキスト特徴量抽出方法、およびプログラムを提供する。 【解決手段】入力されたテキストに対して形態素解析を実行して助詞および助動詞を機能表現として抽出するテキスト解析部と、文章で表される意図をまとめた意図カテゴリと該意図カテゴリに属する機能表現との対応関係を表した意図カテゴリ辞書に基づいて、テキストから抽出された機能表現が属する意図カテゴリを判定し、テキストに含まれる機能表現の数を意図カテゴリ毎に計数したスコアを出力するスコア計算部と、スコアに基づいて、テキストが表すそれぞれの意図カテゴリの割合を算出して文章が表す意図を推定し、意図カテゴリの割合とテキストとを対応づけた推定結果を出力する意図カテゴリ推定部と、を備える。 【選択図】図1
PROBLEM TO BE SOLVED: To provide a text feature amount extraction device, a text feature amount extraction method, and a program for corresponding to Japanese and estimating an utterance intention of an inputted text in a text feature amount extraction device for determining a feature amount of a sentence described in a text.SOLUTION: The text feature amount extraction device includes a text analysis part for executing a morphological analysis of an inputted text to extract particles and auxiliary verbs as a functional expression, a score calculation part for determining an intention category to which functional expressions extracted from the text belong on the basis of an intention category dictionary representing a correspondence relation between an intention category obtained by integrating intentions expressed by a sentence and a functional expression belonging to the intention category, and outputting scores obtained by counting the number of functional expressions included in the text in each intention category, and an intention category estimation part for calculating a ratio of respective intention categories represented by the text to estimate an intention represented by the sentence on the basis of the scores, and outputting an estimation result obtained by associating the ratio of intention categories with the text.SELECTED DRAWING: Figure 1

Claims

Description

Topics

Download Full PDF Version (Non-Commercial Use)

Patent Citations (4)

    Publication numberPublication dateAssigneeTitle
    JP-2000339310-ADecember 08, 2000Nippon Telegr & Teleph Corp , 日本電信電話株式会社Method and device for classifying document and recording medium with program recorded thereon
    JP-2003108568-AApril 11, 2003Communication Research Laboratory, 独立行政法人通信総合研究所文章分類方法及び装置
    JP-2004303198-AOctober 28, 2004Ricoh Co Ltd, 株式会社リコーDocument processor, document processing method, and document processing program
    JP-H02158871-AJune 19, 1990Ricoh Co LtdDocument sorting device

NO-Patent Citations (3)

    Title
    JPN6015022038; 諸橋,那須川,長野: 'テキストマイニング:膨大な文書データからの知識獲得-意図の認識-' 情報処理学会全国大会講演論文集 第57回(平成10年後期)(3), 19981005, p.75-76, 社団法人情報処理学会
    JPN6015022039; 那須川 哲哉: 'コールセンターにおけるテキストマイニング' 人工知能学会誌 第16巻第2号, 20010301, p.219-225, (社)人工知能学会
    JPN6015051019; 西原 陽子 外2名: '発話意図を用いた人同士の関与の強さの推定' 言語処理学会第12回年次大会発表論文集 , 20060313, p.81-84, 言語処理学会

Cited By (0)

    Publication numberPublication dateAssigneeTitle