To provide a method and a device for full-text retrieving engine document information extraction which eliminate differences of a retrieval interface that a full-text retrieving engine has and can obtain desirable informa tion without paying attention to which of an RDB and a full-text retrieving engine an information source is and a storage medium stored with a full-text retrieving engine document information extracting program. 全文検索エンジンが持つ検索インタフェースの異種性を解消し、情報源がRDBであるか、全文検索エンジンであるかを意識することなく、所望する情報を取得することが可能な全文検索エンジン文書情報抽出方法及び装置及び全文検索エンジン文書情報抽出プログラムを格納した記憶媒体を提供する。 - 特許庁
When the user focuses on the applied specifier of the text node without annotation in the tree view, the corresponding text node in the corresponding document is emphasis-displayed to the user in order to show the position of the text node without annotation in the data structure to the user. ユーザが、ツリービュー内の所与の注釈なしテキストノード指示子にフォーカスした場合、データ構造で注釈付けされていないテキストノードの位置をユーザに示すために、対応する文書内の対応するテキストノードがユーザに対して強調表示される。 - 特許庁
To take out contents such as a 'text', a 'picture' and a 'table' from an electronic document and to make them integrally handleable and reusable. 電子化文書から、「テキスト」、「ピクチャ」、「表」等のコンテンツ(部品)を取り出し、統合的に扱うことや再利用することを可能にする。 - 特許庁
To provide a method, a system and a computer readable record medium for refining a web document using text pattern extraction. テキストパターン抽出を用いてWeb文書をリファインするための方法、システム及びコンピュータで読取可能な記録媒体を提供する。 - 特許庁
Then, the sentences included in the document image data are converted into text data, and the diagrams are cut out as they are as the image data. そして、文書画像データに含まれる文章をテキストデータ化する一方で、図表はイメージデータとしてそのまま切り出す。 - 特許庁
An automatic Web page textdocument detection device (2) has an acquisition unit (21); a selection unit (22); and an output control unit (24). 本発明のWebページ文章自動検出装置(2)は、取得部(21)と、選択部(22)と、出力制御部(24)とを具備している。 - 特許庁
Accordingly, if a matter is described somewhere in the foreign language document, it shall not be deemed as a new matter beyond the original text.
したがって、外国語書面中のいずれかの個所に記載がある事項であれば、その事項は原文新規事項とはならない。 - 特許庁
To provide a document processing system with which usability of an operator can be improved by realizing an operation screen using a hyper-text. ハイパーテキストを利用した操作画面を実現することで、オペレータのユーザビリティを向上させた文書処理システムを提供する。 - 特許庁
To provide a method of receiving a document encoded in a markup language and including a page including an image and a text, and processing it by a computer. マークアップ言語で符号化された、画像とテキストを含むページを含む文書を受け取りコンピュータで処理する方法の提供。 - 特許庁
To provide an information retrieval system for more accurately reflecting the anchor text of an inter-document link on information retrieval. 文書間リンクのアンカーテキストを、より的確に情報検索に反映させることができる情報検索システムを提供する。 - 特許庁
And a method for deciding the topic of a textdocument including the copy of an audio track, a newspaper article and a journal paper is disclosed. オーディオトラックと新聞記事とジャーナル紙との写しを含むテキストドキュメントの話題を決定する方法もまた開示される。 - 特許庁
Information identifying the electronic document files, location information, print data, and image data are stored in association with text data for each page. ページごとのテキストデータに対応付けて、電子文書ファイルを識別する情報、位置情報、印刷データ及びイメージデータを記憶する。 - 特許庁
To provide an environment for enabling a user to be concentrated in a reading action to a hyper text electronic document displayed on a screen. 画面表示したハイパーテキスト電子文書に対する読書行為にユーザが集中することのできる環境を提供する。 - 特許庁
A division means 20 generates word information of a word string and clause information of a clause string from text information of the document. 分割手段20は、原稿のテキスト情報から単語列の単語情報及び文節列の文節情報を生成する。 - 特許庁
To easily check change places in each change document when there are a plurality of change documents for an original text. 原本に対して複数の変更文書がある場合に、変更文書毎の変更箇所の確認を容易に行えるようにする。 - 特許庁
A full text index storage part 12 stores the index formed with element documents constituting each composite document as a unit. 全文インデックス格納部12は、複合文書の各々を構成する要素文書を単位に作成されたインデックスを格納する。 - 特許庁
To provide an automatic Web page document detection device which can automatically acquire text data needed by a user. 利用者が必要とするテキストデータを自動的に取得することができるWebページ文章自動検出装置を提供すること。 - 特許庁
A retrieval part 15 executes the full-text retrieval with ranking to the document DB 16 on the basis of the extracted query. 検索部15は、この抽出されたクエリに基づいて文書DB16に対し、ランキング付きの全文検索を実行する。 - 特許庁
A computer 100 performs hierarchical topic clustering of text data based on a statistical modeling of co-occurrence of a pair (document and word). コンピュータ100は、(文書、単語)ペアの共起の統計的モデリングに基づき、テキストデータの階層的トピッククラスタリングを実施する。 - 特許庁
The structured document conversion device comprises: a structural analysis section 32 analyzing the structure of the structured document to prepare tree structure including hierarchical information specifying the parent-child relationship of each node of an element and the text; and a tree structure conversion section 36 reducing the number of hierarchies of the structured document by extracting a text node based on the tree structure. 構造化文書の構造を解析し、要素及びテキストの各ノードの親子関係を特定する階層情報を含む木構造を作成する構造解析部32と、該木構造に基づいてテキストノードを抽出することにより、構造化文書の階層を減らす木構造変換部36とを備える。 - 特許庁
The computerized document editing program is constituted in such a way that the sign in the image information is read, associated with a sign in the text information, the sign in the image information is highlighted when the sign in the text information is specified and editing of the next unedited computerized document is automatically started concurrently with the storing of an edited computerized document. イメージ情報中の符号を読み取ってテキスト情報中の符号と関連付け、テキスト情報中の符号を指定するとイメージ情報中の該当符号が強調表示されるようにし、編集済み電子化文書を保存すると同時に次の未編集電子化文書の編集を自動的に開始するようにした。 - 特許庁
An information adding device 1 separates descriptions of document data to be checked into document process units, and outputs text with position information where the units separated are numbered. 情報付加装置1は、チェック対象の文書データの記述を文書処理単位ごとに区切り、区切った単位に対して番号を付与した位置情報付きテキストを出力する。 - 特許庁
Hence, if the PDL data D1 is once inputted, it is possible to execute both the printing of the document indicated by the PDL data D1 and storing the text data D3 of the document. よって、PDLデータD1を一度入力すれば、PDLデータD1によって示される文書の印刷とこの文書のテキストデータD3の保存との双方を行うことができる。 - 特許庁
A feature word generating unit 201 extracts keywords representing features about security management from the text information of a document file for teacher data managed by a document management system 10. 特徴語作成部201は、文書管理システム10で管理されている教師データ用の文書ファイルのテキスト情報から、機密管理に関する特徴を示すキーワードを抽出する。 - 特許庁
As a result, it is possible to accurately handle numeric representation, and to more precisely achieve text mining or document summarization and document retrieval including the numeric representation than a conventional manner. その結果、正確に数量表現を扱えるようになり、数値表現を含むテキストマイニングや文書要約、文書検索を従来よりも精度よく実現できるようになる。 - 特許庁
A control part 2 of a document data processor 1 retrieves category item names relating to each descriptive information in input document data by using a text mining dictionary stored in a storage part 2. 文書データ処理装置1の制御部2は入力文書データ中の各記述情報と関わる分類項目名を記憶部4に記憶されるテキストマイニング辞書を用いて検索する。 - 特許庁
E-mail is converted into a document with a FAX form where the header, the main text and the attached file are regarded to be respectively described on different pages and the converted document is transmitted to the designated facsimile communication unit. E−mailを、ヘッダー、本文、添付ファイルがそれぞれ異なったページに記載されていると見なしてFAX形式に変換し、指定されたファクシミリ通信装置に送信する。 - 特許庁
To provide a chronological table item presentation device or the like which can correlate a chronological table item added to an electronic document with a composing document of corresponding text and present them. 電子文書に付加された年表事項と対応する本文の構成文書とを対応付けて提示することができる年表事項提示装置等を提供することを目的とする。 - 特許庁
A logical structure extraction processing part 312, a morpheme analysis part 314 and a semantic class analysis part 316 analyze the document inputted by the textdocument input part 311. 論理構造抽出処理部312、形態素解析部314および意味クラス解析部316は、テキスト文書入力部311によって入力された文書を解析する。 - 特許庁
To provide a document quality evaluation system that presents examples of a sentence to be improved and a sample sentence, in addition to a result of evaluating quality of a textdocument group, to an input person. 入力者に対してテキスト文書群の品質の評価結果に加えて、改善すべき文章および見本とすべき文章の例を提示する文書品質評価システムを提供する。 - 特許庁
An area division part 301 extracts an object, an anchor expression annexed to the object and a text including the anchor expression from image data based on a paper document and an electronic document. 領域分割部301は、紙文書、及び電子文書に基づくイメージデータから「オブジェクト」と「オブジェクトに付随するアンカー表現」と「アンカー表現を含む本文」を抽出する。 - 特許庁
A chapter/paragraph extraction part 12 extracts chapter/paragraph items from a plurality of document files constituting a manual text, which are preliminarily formed and stored in a document file storage part 11. 章・節抽出部12は、予め作成されて文書ファイル格納部11に格納されている、マニュアル本文を構成する複数の文書ファイルから、章/節項目を抽出する。 - 特許庁
An electronic document analyzing device 103 syntax-analyzes the detected electronic document, and extracts texts including designated text contents, and classifies the extracted texts by predetermined several items. この検出された電子文書を電子文書解析装置103が構文解析して、指定された文章内容を含む文章を抽出し、所定の複数の項目で分類する。 - 特許庁
The particular text data determines the importance of the document image, and if the registration of the image data in the document management system 140 fails, an email reflecting the importance is sent. この特定のテキストデータに従って文書画像の重要度を決定し、文書管理システム140への画像データの登録失敗の際には、重要度が反映された電子メールを送信する。 - 特許庁
Then, display data, in which a character string shown by the documenttext data and a button related to the data identifier are allocated, for a document screen are created to be transferred to a computer device 10. そして、文書テキストデータが示す文字列とデータ識別子に関連付けられたボタンとを割り付けた文書画面の表示データを生成してコンピュータ装置10へ引き渡す。 - 特許庁
An element is extracted from the structured document, based on any of an area in an image of the element included in the structured document and a data amount of a text indicated by the element in the image. 構造化文書に含まれる要素の画像における面積及び画像において要素が示すテキストのデータ量のいずれかに基づき、構造化文書から要素を抽出する。 - 特許庁
There are particularly extensive descriptions related to Nigihayahi (child of Tenjin (god of heaven)), the Soshin (ancestor honored as god) of the Mononobe clan, which led to opinions that the text were extracted from a Mononobe document, a document that no longer exists.
また、物部氏の祖神であるニギハヤヒ(にぎはやひのみこと)に関する独自の記述が特に多く、現存しない物部文献からの引用ではないかと考える意見もある。 - Wikipedia日英京都関連文書対訳コーパス
When the output file is a document file, it is recommended to convert text information included in the document file into audio format data and record the data also in the recording procedure. さらに、出力ファイルが文書ファイルであった場合にそこに含まれるテキスト情報を音声フォーマットのデータに変換し、記録手順でそのデータも記録するようにするとよい。 - 特許庁
The PDF file is outputted as document data for browsing, the text file is outputted as document data for retrieval from a data output means 15 and the files are registered in the database system 20. PDFファイルは閲覧用文書データとして、テキストファイルは検索用文書データとして、それぞれデータ出力手段15から出力され、データベースシステム20に登録される。 - 特許庁
To easily read text or graphs on a reproduced image or to display more document image information on the reproduced image in a monochromatic reproduction of a color document image. カラーの原稿画像をモノクロ画像に再生する場合に、再生画像上の文字やグラフの判読を容易にし、あるいは再生画像上により多くの原稿画像情報を表示する。 - 特許庁
This significant keyword extraction device is configured to extract the significant content of a Web document, and to extract keyword candidates from the text in the document, and to calculate and rank the significance of the extracted keywords. 本発明は、Web文書の主要コンテンツの抽出を行い、文書内のテキストからキーワード候補を抽出し、抽出されたキーワードの重要度を算出し、順序付けを行う。 - 特許庁
When a user inputs a nonindexed document to a document inquiry system 212, the system 212 decomposes the document into zones and appends a note composed of a text, image feature, or their combination to one or more zones. ユーザは索引付けされていない文書を文書照会システム212に入力し、同システム212はその文書をゾーンに分解し、1つ以上のゾーンにテキスト、イメージ特徴又はそれらの組み合わせからなる注釈を付ける。 - 特許庁
A supplementary explanation text layer where the translation words are disposed in positions corresponding to positions between lines close to the words or collocations is laid on top of an original document image layer made of the original document image, to create a document image with the supplementary explanations. 単語又は連語に近接する行間の位置に相当する位置に訳語を配置した補足説明テキストレイヤを、原文書画像からなる原文書画像レイヤに重ねることにより補足説明付文書画像を生成する。 - 特許庁
On the computer screen of the user, a document tool pane can be opened in the part adjacent to a document to be edited for offering a document tool and control or help contents, which are related to a context of a text or data pointed by the cursor. ユーザのコンピュータ画面上で、カーソルが置かれたテキストまたはデータのコンテキストに関連した文書ツール、制御またはヘルプコンテンツを提供するために編集される文書に隣接した部分に、文書ツールペインを開くことができる。 - 特許庁
When a tag is stuck on a document by using a document utilizing tool 24, an annotation extraction part 62 extracts the tag from the document and a message generation part 63 converts a text written to the tag into a message which can be delivered by mail. 文書利用ツール24を用いて文書に付箋が貼り付けられたとき、アノテーション抽出部62は、文書から付箋を抽出し、メッセージ作成部63は、付箋に書き込まれたテキストをメール配信可能なメッセージに変換する。 - 特許庁
To provide a document retrieving device which can perform full-text retrieval from a document by using relatively small capacity indexes even when the document has unclear word punctuations of not only English, but also Japanese. 欧米語に限らずたとえば日本語のように単語の区切りが明確でない文書に対しても、比較的小さな容量のインデックスを用いて文書の全文検索を実行することができる文書検索装置を提供する。 - 特許庁
A search server 105 is provided with a metadata DB 106 for recording metadata of a document to search for the document in the file server, and an index DB 107 for recording a search index that is text data of a document file. 検索サーバ105は、ファイルサーバ中の文書を検索可能とするために文書のメタデータを記録するメタデータDB106と、文書ファイルのテキストデータである検索インデックスを記録するインデックスDB107と、を備える。 - 特許庁
To provide a document preparing device, a printing device, a document processing method and a program for enabling a user to correctly prepare a textdocument using a symbol available only in a specific region even when the user does not have any special knowledge about the region. 特定の地域に関して特別な知識がなくても、その地域においてのみ通用する記号を用いたテキスト文書を正確に作成可能な文書作成装置、印刷装置、文書処理方法、プログラムを提供する。 - 特許庁
To provide a document preparing device, a printing device, a document processing method and a program for enabling a user to surely prepare a textdocument using a symbol which is available only in a specific region even when the user does not have any special knowledge about the region. 特定の地域に関して特別な知識がなくても、その地域においてのみ通用する記号を用いたテキスト文書を正確に作成可能な文書作成装置、印刷装置、文書処理方法、プログラムを提供する。 - 特許庁
The document processing apparatus 1 computes degree of background indicating degree being background graphic concerning the area where the superposed text areas are superposed in the non-text area (Step S12) and detects the text in drawing for removing it from candidates for the index area from among the superposed text areas based on the result of computation of the degree of background (Step S14). 非テキスト領域のうち、重畳テキスト領域が重なった領域について、背景グラフィックである度合いを表わす背景度を算出し(ステップS12)、背景度の算出結果に基づいて、重畳テキスト領域のうち、見出し領域の候補から除外するための図中テキストを検出する(ステップS14)。 - 特許庁