The image data of a character area and the image data of the particular image area are segmented, text data is generated from the document area image data, and the language is identified. そして、文字領域の画像データと特定画像領域の画像データとを切り出し、文書領域の画像データからテキストデータを生成して言語を特定する。 - 特許庁
To perform printing with enhanced variety by an application program 10 having only a basic document editing function such as a text editor and to superimpose a master page 26 having the same contents in all application programs by setting the master page 26 once without depending on the application program 10. テキストエディタの様な基本的な文書編集機能しか備えていないアプリケーションプログラム10にあっても、変化に富んだ印刷を可能とする。 - 特許庁
A textdocument which may be obtained from a first speech recognition pass is subject to segmentation and to an assignment of topic specific models for each obtained section. 第1のスピーチ認識パスから取得されうるテキスト文書は、セグメント化されそれぞれの取得されたセクションごとにトピック特有のモデルの対応付けを施される。 - 特許庁
The system 1 acquires the page information to be presented to the user at first from the multimedia document information and marks a character string matched with the retrieving condition in a text. ページ識別子により、マルチメディア文書情報から最初に利用者に提示するページの情報を獲得し、テキスト中で検索条件に合致する文字列にマークを付ける。 - 特許庁
The phrase extraction unit is configured to perform morphological analysis of a text contained in the partial document and to extract words, or objects of a start position of the rereading, as one or more candidate words. 語句抽出部は、部分文書に含まれる文を形態素解析し、読み直しの開始位置の対象となる語を1以上の候補語として抽出する。 - 特許庁
From this time on, during the time from the Mid-Heian period up to the Mid-Edo period, the document was respected as the oldest historical text, more so than the "Kojiki" (The Records of Ancient Matters) or the "Nihonshoki" (Chronicles of Japan).
このことなどから、平安時代中期から江戸時代中期にかけては日本最古の歴史書として『古事記』・『日本書紀』より尊重されることもあった。 - Wikipedia日英京都関連文書対訳コーパス
A retrieval execution part 112 retrieves documents corresponding to retrieval conditions, and stores each retrieval result which is each text information of each retrieval result document, into a retrieval result holding part 12. 検索実行部112が、検索条件にあう文書を検索し、各検索結果文書の各テキスト情報である各検索結果を、検索結果保持部12に格納する。 - 特許庁
The system comprises machine-readable data such as DataGlyphs and human-readable data, such as rendering text of the DataGlyphs that are applied on the document. システムは、Dataglyphのような機械可読データと、DataGlyphの表現テキストのような人間可読データとを含み、これらは文書に適用される。 - 特許庁
A text analysis part 2 divides an input character string into words by taking a morpheme analysis of a hypertext document and decides whether each word is link information. テキスト解析部2は、ハイパーテキスト文書に対して形態素解析処理を行い入力文字列から単語を分割し、各単語がリンク情報であるか否かを判別する。 - 特許庁
These documents are interweaved into the body of the text, preceded by lines like 'today such a document as follows has been issued by a superior,' and the original documents are sometimes cited or reproduced in the records.
文中では「今日こういう下文が下された」という形で地の文の中に織り込まれているものや、引用・転載のような生の形で記されていることもある。 - Wikipedia日英京都関連文書対訳コーパス
To provide a device capable of separately handling a type-printed part and a hand-written part included in text data representing contents of a document written on a paper medium. 紙媒体に記された文書の内容を示すテキストデータに含まれる、活字部分の取扱と手書部分の取扱とを個別に操作しうる装置を提供すること。 - 特許庁
In the drag document mode (state ST2), a drag command such as the selection of a text included in the content and the movement of an object included in the content is generated in accordance with a touch operation. ドラッグドキュメントモード(状態ST2)では、タッチ操作に応じて、コンテンツに含まれるテキストの選択やコンテンツに含まれるオブジェクトの移動などのドラッグ指令が生成される。 - 特許庁
When the arrangement error is still present, re-translation processing consisting of either or the both of translation method change processing for changing the method of translation or translated document change processing for changing the translated document is performed based on the translation result to change the translation content, whereby the translated text is matched to the layout of the original text. 依然として配置エラーが有る場合に、翻訳結果に基づいて、翻訳の方法を変更する翻訳方法変更処理あるいは翻訳後の文書を変更する翻訳文書変更処理のいずれか一方もしくは両方の処理からなる再翻訳処理を行い、翻訳内容を変更して翻訳文を原文のレイアウトに整合させる。 - 特許庁
The text file to be displayed in a text box is designated in a file head part (HEAD) of the document described in the markup language using a designated control code INCLUDE (step S901) and stored as an independent file separate from the layout part (BODY) of the document file described in the markup language (steps S910, S911, S912). テキストボックスの中に表示するテキストファイルを、マークアップ言語で記述された文書のファイルのヘッド部(HEAD)で、所定の制御コードINCLUDEを用いて指定することによって(ステップS901)、そのマークアップ言語で記述された文書のファイルのレイアウト部(BODY)とは分離して独立ファイルとして保存する(ステップS910、S911,S912)。 - 特許庁
A document analysis function unit 3 extracts an attribute of an information component to be an information unit of a tabulation target from each document of a document set P, attaches a prefix corresponding to an attribute name of the information component to each attribute value, and stores a tuple comprising an aggregate of attributes in a database 7 of a full-text retrieval engine 4. 文書解析機能部3は、文書集合Pの各文書から集計対象の情報単位となる情報要素が持つ属性を抽出し、情報要素の属性名に応じたプレフィックスを各属性値に付与して属性の集合からなるタプルを全文検索エンジン4のデータベース7に格納する。 - 特許庁
Since the text data extracted from each document file is described on the registering file and outputted, a registering module 12 can efficiently register the document information in a knowledge DB 131 in a common format without considering difference between file formats of obtained document files. 各文書ファイルから抽出されたテキストデータを登録ファイル上に記述して出力することにより、登録モジュール12なおいては、取得された文書ファイルのファイル形式の違いを考慮することなく、それらの文書情報を共通のフォーマットで知識DB131に効率よく登録することができる。 - 特許庁
This structured document storage device is provided with a document decomposition processing part 21 for decomposing the original text 1 of the structured document into a tree structure composed of nodes and elements, a structure constitution processing part 22 for constituting a tag list structure based on the result of decomposition and a structure storage part 3 for storing at least the tag list structure. 構造化文書格納装置は、構造化文書の原文1をノード及び要素からなる木構造に分解する文書分解処理部21と、分解の結果に基づいて、タグリスト構造を構成する構造構成処理部22と、少なくともタグリスト構造を格納する構造格納部3とを備える。 - 特許庁
A classification renewing processing part 12 analyzes text data corresponding to the document of the classification object, extracts the word or the compound word included in the document of the classification object as classification object words and phrases, compares the classification ontology and the classification object words and phrases, and discriminates classification to which the document of the classification object belongs. 分類更新処理部12は、分類対象の文書に対応するテキストデータを解析し、当該分類対象の文書に含まれる単語あるいは複合語を分類対象語句として抽出し、分類オントロジーおよび分類対象語句を比較し、分類対象の文書が属する分類を判別する。 - 特許庁
A DB retrieval starting part 24 receives the DB access authority level of the user from the user identifying part 22, and starts a document DB retrieving part 32, and the document DB retrieving part 32 refers to an index corresponding to the DB access authority level of the user to retrieve the full text of the document, and transmits the retrieval result to a retrieval result transmitting part 23. DB検索起動部24は利用者認証部22からユーザのDBアクセス権レベルを受け取り文書DB検索部32を起動し、文書DB検索部32はユーザのDBアクセス権レベルに応じたインデックスを参照して全文検索を行い検索結果を検索結果送信部23に送る。 - 特許庁
When two full-text retrieval registration processings and retrieval systems corresponding to them are respectively executed as temporary registration and main registration, a document is registered in a document database by executing temporary registration, and executing main registration at night. 全文検索用の登録処理の際に他のアプリの妨げにならないように負荷の軽い全文検索登録処理を行うと共に恒久的には、検索速度が速く、全文検索情報がコンパクトな全文検索を使えるようにする。 - 特許庁
In this case, the attribute of each part image of the document image 101 is checked on the basis of the document image understanding data 111 and when the area indicates a text area, the image is stored as a binary image and when not so, the original image is entirely selected and stored. この際、その文書画像理解データ111に基づいて文書画像101の各部分画像の属性を調べ、その領域がテキストであれば二値画像として記憶し、そうでないときは原画像全体を選択して保存する。 - 特許庁
For example, concerning a document which is much more likely linked to the other documents in the same server or a document including a keyword which is the same or similar to the retrieval condition in the anchor text being the link origin, the calculated matching level is increased with a much higher rate. たとえば、同一サーバ内の他の文書に多くリンクしている文書、リンク元のアンカーテキストに検索条件と同一または類似のキーワードを含む文書などについて、算出済みの合致度をより高い割合で水増しする、など。 - 特許庁
Since an imaging optical element 5 can optically detect and read an entire document 1 including image information and text information, the classification of the document and the classification and position of a diffraction structure 11 can be determined. 撮像光学素子5は、画像情報およびテキスト情報をはじめとする文書1全体の光学的検出および読み出しを行うことができるため、文書の種類および回折構造11の種類および位置を決定することも可能である。 - 特許庁
To provide document data registering system and method capable of easily setting up link information of one of words and phrases in a textdocument with a plurality of files and to provided also a recording medium recording a program for realizing the method. テキスト文書中の一つの語句に対して複数のファイルとのリンク情報の設定を容易にする、文書データ登録システム,文書データ登録方法およびこの方法を実現するためのプログラムを記録した記録媒体を提供すること。 - 特許庁
To detect different types of data in a visually displayed document, such as tables, components and associated text, that may have unwanted graphics interspersed therein, and to retrieve each type of the data in a different manner for application to an object document. 不所望のグラフィックスが挿入されるかもしれないテーブル、コンポーネント、及び関連したテキストのようなビジュアル表示文書内の異なるタイプのデータを検出し、かつ、目的文書に適用するために異なる態様で各タイプのデータを検索する。 - 特許庁
To provide a device and a method for checking an optical diffraction structure on a document, which allow text data and/or image data to be optically read by one same checking device without moving a mechanical part or the document to be checked. 文書上の光学回折構造を検査するための、機械部分または検査される文書を移動することなく、同一の検査装置によってテキストデータおよび/または画像データの光学読み出しを行うことができる装置および方法の提供。 - 特許庁
Text data is translated (S3) when text data exists in an HTML document (S2: YES), picture data is analyzed (S5) when picture data exists (S4: YES), a character is segmented (S7) when the character part of picture data exists (S6: YES) and, then, the character is recognized (S8). HTML文書にテキストデータがある場合には(S2:YES)テキストデータを翻訳し(S3)、画像データがある場合には(S4:YES)、画像データの解析を行い(S5)、画像データの文字部がある場合には(S6:YES)、文字を切り出し(S7)、文字認識を行う(S8)。 - 特許庁
Accordingly, "the original text" referred to in "new matter beyond the original text" in this Part VIII means "foreign language document" in the case of a foreign language application, or "description, claims and drawings of an international application as of the filing date of the international application" in the case of a foreign language PCT application.
そこで、本項において「原文新規事項」という際の「原文」とは、外国語書面出願にあっては「外国語書面」であり、PCT外国語出願にあっては「国際出願日における国際出願の明細書、請求の範囲及び図面」をいう。 - 特許庁
In technique for analyzing the document using a conversation theory, texts are classified by text construction unit such as contents, a function set phrase or a modifying phrase and mutual connection through the use of coordinate, subordinate and two-clause confrontation relation is given to the classified text construction units. 談話の理論を用いる文書分析のための技法は、内容、機能成句、及び修飾成句のテキスト構築単位に、テキストを分類し、且つ該分類されたテキスト構築単位に、等位、従属及び二項対立関係を用いる相互の関連付けを与える。 - 特許庁
A document read as an image is divided into areas corresponding to plural attributes including a text (S33), character recognizing processing is performed to the divided text areas (S34), the kind and connecting method of the client are identified (S401) and corresponding to the identified kind of the client and a request from the client, the summary of the text is generated (S406). イメージとして読み込んだ文書を、テキストを含む複数の属性に応じて領域分割し(S33)、分割されたテキスト領域に対して文字認識処理を行い(S34)、クライアントの種類及び接続方法を識別し(S401)、識別されたクライアントの種類及びクライアントからの要求に応じて、テキストに対して要約を生成する(S406)。 - 特許庁
Link information designated by text information and URL(Universal Resource Locator) is acquired from the information of an HTML(Hyper Text Markup Language) document described in an HTML designated by a user and after the text information is provided to the user, similar processing is performed to a file at a place designated by the acquired link information. ユーザが指定したHTML(HyperText Markup Language)で記述されたHTMLドキュメントの情報より,テキスト情報及びURL(Universal Resource Locator)によって指定されるリンク情報を取得し,テキスト情報をユーザに提供した後,取得したリンク情報の指定する場所にあるファイルに対して同様の処理を行う。 - 特許庁
The method which detects page numbers of a document includes discriminating one or more text fragments from a plurality of pages of a document; discriminating at least one sequence, from the discriminated text fragments, which includes a plurality of paragraphs and which follows at least one prescribed numbering system; calculating subsets of the discriminated sequences; and interpreting at least some of the paragraphs of the subsets as page numbers of the pages of the document. 文書のページ番号検出方法は、文書の複数のページから1以上のテキスト断片を識別し、前記識別されたテキスト断片から、複数の項を各々含み、少なくとも1つの所定のナンバリング方式に従った、少なくとも1つのシーケンスを識別し、前記識別されたシーケンスの部分集合を計算し、前記部分集合の項の少なくとも幾つかを文書のページのページ番号と解釈することを含む。 - 特許庁
A relation analyzing part 2 analyzes the sentence structure of the text information that is extracted by a document input part 1 and extracts the binary relation of words to transmit it to a relation selection part 5. 関係解析部2は、文書入力部1で抽出したテキスト情報に対して係り受け解析を行い、単語の2項関係を抽出して、関係選択部5に伝達する。 - 特許庁
The management server 20 extracts a document in which precautions are explained on the basis of prescribed keywords, formats, etc. from a text of an electronic manual or an operation manual stored in the manual DB 21. 管理サーバ20がマニュアルDB21に格納された電子マニュアルや作業指示書の本文から特定のキーワードや書式などを基に注意事項を説明した文書を抽出する。 - 特許庁
In some implementations, the additional documents may be presented in-line with the document being read, such as through an in-link link or text snippet. いくつかの実施態様において、追加ドキュメントは、インリンク・リンク(in−link link)またはテキスト断片(text snippet)を経て、読まれるドキュメントのインラインに提供されてもよい。 - 特許庁
To provide a space-saving printing mechanism, capable of reducing paper, which does not need time and effort for correction, even in such a document that has no distinction between text and a header/footer as in a PDF. PDFのように本文とヘッダ・フッタの区別がないような文書においても、修正の手間のない、用紙の削減を可能にする間締め印刷の仕組みを提供すること - 特許庁
In one instance of the present invention, an annotation recognition method obtains an input of strokes that are grouped, classified, and anchored to underlying text and/or points in a document. 本発明の一実施例では、注釈認識方法により、グループ化され、分類され、文書内の基本テキストおよび/または点へのアンカーが作成されるストロークの入力が得られる。 - 特許庁
This system is provided with storage devices 46-49 for plural text documents, front end processors 56-58 and at least one of processors 42-44 connected to the document storage devices 46-49. システムは、複数のテキスト文書に対する記憶装置46〜49、フロントエンド・プロセッサ56〜58及び文書記憶装置46〜49に結合された、少なくとも一つのプロセッサ42〜44を含む。 - 特許庁
Differential color or luminance signals are used to imbed a binary message to a stroke part selected from a text of a document and to extract the message imbedded in this way. 文書のテキストにおける選択された字画区間に二値メッセージを埋め込むと共に、斯様にして埋め込まれたメッセージを抽出するために、差動的なカラー又は輝度信号が使用される。 - 特許庁
When an operation button corresponding to "decision" is pressed, marking is defined, and the cellular phone 14 transmits marking position information, marking kind information and text information to a document management server 22. 「決定」に該当する操作ボタンを押すとマーキングが確定し、携帯電話14は、マーキング位置情報、マーキング種類情報、及びテキスト情報を文書管理サーバ22に送信する。 - 特許庁
The text data of an audio output object in the multi- modal document are synthesized in voice by an audio synthesizing part 206 and that synthesized output voice is outputted by a voice output part 207. マルチモーダル文書中の音声出力対象のテキストデータを、音声合成部206で音声合成し、その合成した出力音声を音声出力部207で出力する。 - 特許庁
To provide a document preparing method capable of easily editing without destroying the appearance of the entire page even if text data is modified on a page using a floating frame. 本発明は、浮動枠を用いたページ上でテキストデータが修正されてもページ全体の体裁が崩れることなく、容易に編集することができる文書作成方法を提供する。 - 特許庁
Portions of a document, such as individual paragraphs or groups of paragraphs or fragments of text, are provided with self-describing properties, such as file format type associated with the portion, style, font, list type, and the like. 個々の段落や段落群、あるいはテキストの断片など、文書部分に、その部分に関連するファイル・フォーマット・タイプやスタイル、フォント、リストタイプなど、自己記述型の属性が提供される。 - 特許庁
To provide a system, which is capable of readily inputting a word included in a reference text, particularly the word of which reading is incomprehensible for a user, when preparing document and Japanese input. 文書作成および日本語入力の際、参照テキスト内に含まれている単語、特にユーザにとって読みの判らない単語を簡易に入力することのできるシステムを提供する。 - 特許庁
The text analysis is carried out on fault example documents in the same way, to generate feature data of each document, and the similarity between the feature data and reference feature data is computed. また、不具合事例文書に関しても同様のテキスト解析を実行して各文書の特徴データを作成し(ニ、ホ)、これらの特徴データと基準特徴データとの類似度を算出する。 - 特許庁
To provide an information processor generating a PDF (Portable Document Format) file holding a high-definition text object with a high compression ratio, and to provide its control method and a program. 高い圧縮率で且つ高品位のテキストオブジェクトを保持したPDFファイルを生成することができる情報処理装置及びその制御方法、並びにプログラムを提供する。 - 特許庁
A label adding section 36 adds a label according to the character string condition to a character string satisfying each character string condition included in a textdocument according to the determination result of the determination section 34. ラベル付与部36は、判定部34の判定結果に応じて、テキスト文書に含まれる各文字列条件を満足する文字列に該文字列条件に応じたラベルを付与する。 - 特許庁
To provide an e-mail document receiving and printing system which prevents a text of e-mail which has a character string length of zero or is constituted of only non-printing characters, from being printed and output. 文字列長が0であるか非印字文字のみで構成されている電子メールの本文が印刷出力されるのを防ぐ電子メール入稿印刷システムを提供すること。 - 特許庁
A character part paste section 207 generates an image (background image) by pasting the text area of the color document image 201 analyzed by an area analysis section 203 by a prescribed color. 一方、文字部塗りつぶし部207では、カラー文書画像201において、領域解析部203で解析されたテキスト領域を所定の色で塗りつぶした画像(下地画像)を生成する。 - 特許庁
Even the text ratio of the structured document data is thereby compressible to about 1/20, and disk input/output can be considerably reduced to improve storage efficiency. これにより、構造化文書データの原文比でも1/20程度に圧縮することができ、ディスクI/Oを大幅に低減することができるので、格納効率を向上させることができる。 - 特許庁