A difference between a scan image obtained by scanning a paper document and a print source document file therefor is extracted as an added image, and the extracted added image is stored in association with a text character string within the print source and text metadata of the text character string. 本発明では、紙文書をスキャンしたスキャン画像とその元となった印刷元ドキュメントファイルとの差分を付加画像として抽出し、その抽出した付加画像を印刷元ドキュメントファイル内のテキスト文字列およびそのテキスト文字列が持つテキストメタデータと関連付けて保管する。 - 特許庁
Keywords are extracted from new document information converted into text data by an OCR 2 by a keyword extracting part 20, extracted keywords of existing document information are read from a document information DB in a storage 7, both are compared, and document type information of existing document information with the most number of matching keywords is set as a document type of the new document information. OCR2によりテキストデータ化された新文書情報からキーワード抽出部20でキーワードを抽出して、記憶装置7内の文書情報DBから既存文書情報の抽出キーワードを読み出して両者を比較し、一致するキーワード数の多い既存文書情報の文書タイプ情報を新文書情報の文書タイプとして設定する。 - 特許庁
A featured character string extracting program 150 extracts a featured character string from the text of the specified seed document. 特徴文字列抽出プログラム150は、指定された種文書のテキストから特徴文字列を抽出する。 - 特許庁
A text file changing part 14 changes the file name and character/paragraph of each document file according to the new file name. 本文ファイル変更部14は、新ファイル名によって、各文書ファイルのファイル名、章/節項目を変更する。 - 特許庁
To enable a reader to better understand a document resulting from converting voice information to text information, without using images. 音声情報からテキスト情報に変換された文書を、画像を用いずに読み手がより理解できること。 - 特許庁
With a multilingual retrieval means 15, a document pair having close semantic contents is extracted on the basis of the text vector. 多言語検索手段15によって文章ベクトルに基づいて意味内容が近い文書ペアを抽出する。 - 特許庁
METHOD, SYSTEM AND COMPUTER READABLE RECORD MEDIUM FOR REFINING WEB DOCUMENT USING TEXT PATTERN EXTRACTION テキストパターン抽出を用いてWeb文書をリファインするための方法、システム及びコンピュータ読み出し可能記録媒体 - 特許庁
Also, the designated display configurations are reflected on the display method of the text template by the document creation means 12. また、文書作成手段12による文書テンプレートの表示方法に、指定された表示態様が反映される。 - 特許庁
METHOD FOR BINARIZING SCANNED DOCUMENT IMAGE INCLUDING GRAY OR LIGHT COLOR TEXT PRINTED BY HALFTONE PATTERN ハーフトーンパターンで印刷されたグレーまたは淡色テキストを含む、スキャンされた文書画像を2値化するための方法 - 特許庁
To provide a method for efficiently collecting documents by retrieval based on text mining and document quotation information. テキストマイニングと文献引用情報による検索により、効率的に文献を収集する方法を提供する。 - 特許庁
To provide a system for efficiently outputting an image suited to the content of an inputted documenttext. 入力される文書テキストの意味内容に適合する画像を効率よく出力するシステムを提供すること。 - 特許庁
To extract a meaningful text block from a document that is optionally subjected to a layout, such as a table, itemization and a multicolumn composition. 表、箇条書き、多段組等任意にレイアウトされた文書から意味のあるテキストブロックを抽出する。 - 特許庁
Thus, it is possible for a user to browse the image or text of each page for each document by designating management units. 利用者は、管理単位を指定して文書ごとに各ページの画像やテキストを閲覧等することができる。 - 特許庁
An older version of this document implied that Linux recognizes the ECMA-48 control sequence for invisible text.
このドキュメントの古いバージョンでは、Linux が ECMA-48 の不可視テキストのコントロールシーケンスを認識するかのように書かれていた。 - JM
The form information includes feature information such as ruled lines and a text of the document and reading conditions when reading the information. フォーム情報は、その文書の罫線、テキストといった特徴情報と読取時の読取条件を含む。 - 特許庁
The import API works with a parser to scan the document and extracts selected element, node, attribute and text. インポートAPIは、パーサと共に働いて、文書をスキャンし、選択された要素、ノード、属性、及びテキストを抽出する。 - 特許庁
Taking a message object structure and producing a flat textdocument is the job of the Generator class.Again, as with the あるメッセージオブジェクト構造をとってきて、そこからフラットなテキスト文書を生成するのは Generator クラスの仕事です。 - Python
To provide a text categorization result display unit for detecting a text group whose relevancy is high by indexing relevance between a generated text group and attribute information, and displaying a document category result based on the information to understandably display the text group whose text data should be read by a user. 生成されたテキストグループと属性情報との間の関連性を指標化して関連性の高いテキストグループを検出し、その情報に基づき文書分類結果を表示することで、テキストデータを読むべきテキストグループを利用者にわかりやすく表示するテキスト分類結果表示装置を提供する。 - 特許庁
When the access level of a copying destination of the document is not included in the disclosure level of the stamp, it is warned that the security level of the document is high by instructing a text (e.g., R1 secrecy) of annotation set to the document. 文書のコピー先のアクセスレベルがスタンプの公開レベルに含まれない場合、文書に設定されたアノテーションのテキスト(例、「R1秘」)を指示するなどして、文書の秘守レベルが高いことを警告する。 - 特許庁
To provide a document classification program for classifying Web document information such as illegal and harmful sites at high speed without analyzing text content or image content in the document information. 例えば違法・有害サイトのようなWeb文書情報における文章内容や画像内容を解析することなく、その文書情報を高速に分類する文書分類プログラム等を提供する。 - 特許庁
To perform retrieval using a selected region as a retrieval key when the region other than a text is selected on a document image, in a document browsing system for browsing the document image. 文書画像の閲覧を行うドキュメント閲覧システムおいて、文書画像上でテキスト以外の領域を選択した際にも、その選択領域を検索キーにした検索を行うことができるようにする。 - 特許庁
In connecting a newly-arrived mail document with a mail document already stored in a mail server, both documents are connected on the basis of a quotation part stated in the text of the newly-arrived document. 新着メール文書と既にメールサーバに蓄積されているメール文書とを関係づける際に、新着メール文書の本文中に記載された引用部分に基づいて両文書を関係づける。 - 特許庁
A document database is retrieved using the generated text feature information and image feature information to obtain the document corresponding to the retrieving document from the plurality of documents (step S95, S96). そして、生成されたテキスト特徴情報とイメージ特徴情報を用いて文書データベースを検索し、複数の文書より当該検索文書に対応する文書を取得する(ステップS95,S96)。 - 特許庁
41392Description: Using the Customizer on an Invalid TLD Document Can Cause Loss of Data.If a TLD document has invalid tags, the customizers might delete or overwrite text in the TLD document. 41392問題: 無効な TLD ドキュメントでカスタマイザを使用すると、データを損なう原因になります。 TLD ドキュメントが無効なタグを持つ場合、カスタマイザは TLD ドキュメントのテキストを削除またはオーバーライドする可能性があります。 - NetBeans
When the recipient 400 desires an original text, the recipient 400 transmits a mail document comprising an original text request command, a sender (requester), and a recipient (mail sender) or the like to the mail server 100. 受信者400は原文を希望する場合、原文要求コマンド、送信者(要求者)、受信者(メール送信元)等からなるメール文書を送信する。 - 特許庁
In the case of a command for an operation instruction other than the command to instruct the next document, a text corresponding to this command is retrieved and processing is performed so that the text can be presented (156). 次のドキュメントを指示するコマンド以外の他の操作命令のコマンドの場合、今回のコマンドに対応するテキストを検索し、提示できるように処理する(156)。 - 特許庁
Text data is received in a data document saved in a data storage device and the data representing each of a plurality of graphic elements corresponding to the received text data is received. データ記憶装置に保存されているデータ・ドキュメント内にテキスト・データを受け取り、受け取ったテキスト・データに対応する複数のグラフィック要素のそれぞれを表すデータを受け取る。 - 特許庁
The filing function part 10 retrieves the specified image file or document file based on data for full text retrieval retrieved by the full text retrieval function part 11. ファイリング機能部10は、フルテキスト検索機能部11により検索されたフルテキスト検索用データに基づいて指定のイメージファイルまたは文書ファイルを検索する。 - 特許庁
A keyword extraction means 44 extracts a keyword from the text data and a database access means 45 associates the text data with the keyword to register them in a document information database 50. キーワード抽出手段44がテキストデータからキーワードを抽出し、データベースアクセス手段45がテキストデータとキーワードを対応付けて文書情報データベース50に登録する。 - 特許庁
The agent generates a summary text of the document to be signed (S12) and sends it to the signer, and the signer displays the summary text on own information terminal (S13). エージェントによって署名対象文書のサマリテキストが生成され(S12)、署名者に送付され、署名者は自己の所有する情報端末でサマリテキストを表示する(S13)。 - 特許庁
A document management device 1 includes a document registration unit 11 which registers a document encrypted with an encryption key; and a decrypted document management unit 12 which acquires text information of a document decrypted according to an instruction of a user having the authority to use a decryption key and an identifier of the user. 文書管理装置1は、暗号鍵で暗号化した文書を登録する文書登録部11と、復号鍵の使用権限を有する利用者の指示で復号化された文書の本文情報及び利用者の識別子を取得する復号化文書管理部12とを備える。 - 特許庁
This document name generation device which generates the document name given when storing an accessed document extracts the event information indicating a predetermined event from a syntactic structure of a text in the accessed document and automatically generates the document name based on the event information. アクセスした文書を保存する際に付与する文書名を生成する文書名生成装置であって、アクセスした文書中のテキスト部分の統語構造から所定のイベントを表すイベント情報を抽出し、イベント情報に基づいて文書名を自動的に生成する。 - 特許庁
The document processor comprises a component element extracting part 102 for extracting at least text elements and image elements from documents; a text summarizing process part 105 for summarizing the text elements; and a summary document composing part 107 for composing summary documents from the summarized texts generated by the text summarizing process part 105 and the image elements selected by an image selecting part 106. 文書から少なくともテキスト要素と画像要素とを抽出する構成要素抽出部102と、前記テキスト要素を要約するテキスト要約処理部105と、テキスト要約処理部105で生成された要約テキストと画像選択部106で選択された画像要素とから要約文書を合成する要約文書合成部107とを備えた。 - 特許庁
In the electronic mail client 110, receiving the text of the electronic mail specified by a user in a reception operation, a pointer indicating the position of a document is turned to a document head, text analysis is performed, one sentence is extracted from the document, and then voice synthetic output of the extracted one sentence is performed. 電子メールクライアント110では、受信操作において、ユーザーが指定した電子メールの本文を受信したときに、文書の位置をしめすポインタを文書先頭にし、テキスト解析を行って該当文書から一文を抽出し、次に、抽出された一文の音声合成出力を行う。 - 特許庁
To make it possible to modify only a text file without modifying a layout part in the case of modifying the text file in an information processing device in which a document file described in a markup language is captured, the document is parsed and contents of the parsed document is displayed. マークアップ言語で記述された文書のファイルを読み込み、その文書を解析し、当該解析した文書の内容を表示する情報処理装置において、テキストファイルを変更する際に、テキストファイルのみ変更するだけで、レイアウト部を変更しないで済むようにする。 - 特許庁
A first digital document to be processed is identified from a plurality of digital documents, and a first characteristic provided with a text that encloses images included in the digital document and is not anchor text, and corresponding to the first digital document is extracted from the plurality of digital documents. 複数のデジタルドキュメントから、処理されるべき第1のデジタルドキュメントを識別し、デジタルドキュメントに含まれる画像を取り囲みかつアンカーテキストではないテキストを備えると共に第1のデジタルドキュメントに対応する第1の特徴を、複数のデジタルドキュメントから抽出する。 - 特許庁
The reference document information includes information on a plurality of reference series document data related to the text data, and even when information required for the translation is few in the text data, the translation environment information for facilitating the translation can be obtained by using the reference document information. 参照文書情報が原文データと関連を有する参照系列の複数の文書データの情報を含んでおり、原文データに翻訳に必要な情報が少ない場合でも、参照文書情報を利用することで、翻訳を容易にする翻訳環境情報を取得することができる。 - 特許庁
Consequently, for example, the original document for outputting an image including an image object and text object is created again into such a document where the image by the original document and an image for expanding and displaying the text object in the original image are outputted to one and the same face of one piece of paper by 2in1. これにより、たとえば、イメージオブジェクトとテキストオブジェクトが含まれる画像を出力するための元文書が、当該元文書による画像とその中のテキストオブジェクトを拡大して表示する画像が2in1によって1枚の用紙の同じ面に出力されるような文書に作り直される。 - 特許庁
The apparatus comprises a registration processing means 3, which selects a text dividing means 6 in response to language information for the document data input from an input means 1, and divides the document data into a token using the text dividing means 6. 入力手段1から入力される文書データの言語情報に応じて登録処理手段3がテキスト分割手段6を選択し、該選択したテキスト分割手段6を用いて文書データをトークンに分割する。 - 特許庁
A personal information detection section refers to the recognition dictionary to determine whether each of words constituting the textdocument is corresponding to personal information, and outputs positional information of each of the words corresponding to the personal information in the textdocument. 個人情報検出部は、認識辞書を参照してテキスト文書を構成する各単語について個人情報にあたるか否かを判断し、個人情報にあたる各単語のテキスト文書内での位置情報を出力する。 - 特許庁
A document record consisting of a text character string and one or more pieces of attribute information is inputted from a document record input means 1 and held in a document record holding means 6, and displayed in table form by a document record display output means. テキスト文字列と1個以上の属性情報とからなる文書レコードは、文書レコード入力手段1から入力されて文書レコード保持手段6に保持され、また文書レコード表示出力手段で表形式に表示される。 - 特許庁
A document created as an independent text file is summarized in the form of Zip or the like, and it is directly dragged and dropped to a printer icon, thus an archived file such as Zip is handled as one document, and texts in the document are successively printed according to Driver setting. 独立した文章ファイルとして作成したDocumentをZip等の形式で纏め上げ、それを直接プリンタアイコンにドラッグ&ドロップすることで、Zipなどのアーカイブされたファイルを1つのドキュメントとして扱い、その中の文章をDriver設定に従い順次印刷する。 - 特許庁
The encapsulated multi-media document 101 includes text information 103 to be expression entities on the document, media information (image, and sound information) 104 to be the expression entities on the document in the same way, document arrangement information 102 for determining the structures of the text information 103 and the media information 104 and the display states on the document, and an operation program file 105. このカプセル化されたマルチメディア文書101は、文書上での表現実体となるテキスト情報103と、同じく文書上での表現実体となるメディア情報(画像、音声情報)104と、テキスト情報103及びメディア情報104の構造と文書上での表示状態を決定する文書配置情報102と、動作プログラムファイル105とを備えて構成される。 - 特許庁
A word importance calculation processing part 5 calculates the importance of the word on the basis of the document frequency or its weighted value and a text association degree calculation processing part 6 calculates the degree of association of the seed text information with each text information included in the text set to be retrieved based on the importance. 文書頻度またはその重み付けした値に基づいて、語重要度計算処理部5が語の重要度を計算し、これに基づいてテキスト関連度計算処理部6が種テキスト情報と検索対象に含まれる各テキスト情報との関連度を計算する。 - 特許庁
A document analysis system 100, while extracting a set of an evaluation expression text indicating an evaluation expression, and a modified word text modified by the evaluation text as a text set from each of questionnaire data acquired via an input interface 110, defines a synonym based on the number of frequencies of appearance of the evaluation expression text, category information and the modified word text. 文書解析システム100は、入力インターフェース110を介して取得した各アンケートデータに対して、評価表現を示す評価表現テキストと当該評価テキストが修飾する被修飾語テキストのセットをテキストセットとして抽出しつつ、評価表現テキスト、カテゴリ情報及び被修飾語テキストの出現頻度数に基づいて同義語を定義するようになっている。 - 特許庁
As a result, copy size can be set more easily, by using a scale factor at the time of a text based document and using the sheet size at the time of photograph based document. この結果、原稿が文書系のときには拡大縮小率を用いて写真系のときには用紙サイズを用いて、コピーサイズの設定をより容易に行なうことができる。 - 特許庁
To retrieve a two-dimensional document at a speed of text search, by encoding two-dimensional structure to a one-dimensional synthetic language, based on two-dimensional information of a document. 書類の2次元情報を当てにし、2次元構造を1次元シンセティック言語にエンコードすることで、2次元書類がテキストサーチの速度で探索できるようにする。 - 特許庁
To provide a document information retrieving device for retrieving document information with higher accuracy of retrieval result than the conventional manner, on the basis of an accepted input text. 受け付けた入力文章に基づいて、従来より検索結果の精度が高く文書情報を検索することのできる文書情報検索装置を提供する。 - 特許庁
To conveniently perform full text retrieval of encrypted and stored document information with access right set by decrypting the document information according to the access right. アクセス権が設定され、かつ、暗号化して格納された文書情報であっても、アクセス権限に従い、復号化して全文検索を利便性よく行うことである。 - 特許庁
If the document image 18 is not a textdocument image, a thumbnail image 42 is generated based on a page image 18a which is most characteristic among the page images 18a. 文書画像18がテキスト文書画像でない場合、各ページ画像18aの中から最も特徴的なページ画像18aを基にサムネイル画像42を生成する。 - 特許庁
Copyright 2001-2004 Python Software Foundation.All rights reserved. Copyright 2000 BeOpen.com.All rights reserved. Copyright 1995-2000 Corporation for National Research Initiatives.All rights reserved. Copyright 1991-1995 Stichting Mathematisch Centrum.All rights reserved.
Copyright (c) 2001 Robert Kiesling. Copyright (c) 2002, 2003 David Merrill. The contents of this document are licensed under the GNU Free Documentation License. Copyright (C) 1999 JM Project All rights reserved.