著者
諸原 雄大 近藤 邦雄 島田 静雄 佐藤尚
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.36, no.2, pp.329-337, 1995-02-15
被引用文献数
8

人がデザイン画についての善し悪しなどの印象を受け取るとき、その基準となる物理的特徴は大きく分けると色と形の二つである。著者らの研究の目的は、色と印象との関係を求めることである。このために、イメージ・カラーを選定する方法を提案する。イメージ・カラーとはデザイン画において用いられている色のうち、特に印象に影響の与える度合が強い色の組合せをいう。イメージ・カラーを選定することによる利点は、デザイン画を見ることにより得られる印象が、イメージ・カラーを見ることにより得られる印象とほぽ同じものとなることである。デザイン画のイメージ・カラーの抽出の方法は配色カードを用いて求めており、経験を必要とする作業である。もしも・イメージ・カラーの自動選定が行えれば、誰にでもデータベースに登録されている画像のイメージ・カラーを求めることができ、新しいデザイン画に他のデザインのイメージを与えることが簡単にできるようになる。本論文においては、デザイナーのイメージ・カラー選定法を参考に、計算機におけるイメージ・カラーの選定法を提案する。デザイン画像はRGBの3原色、各8ビット階調により表現されているものを用いた。このデザイン画像において便用されている色を色空間上でまとめていくことにより色の限定を行い、その中から目立つ色を取り出した。この方法により、計算機においてイメージ・カラーを選定することができるようになった。
著者
小山 友介
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告電子化知的財産・社会基盤(EIP) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.17, pp.27-34, 2006-02-18

本研究では,家庭用ゲーム産業の活性化状況を調査することを目的として,『ファミ通ゲーム白書』にある1996年から2004年までの販売トップ100データを用いて,販売タイトルについてシリーズ作品・移植作品・版権もの作品などの各属性をもつタイトル数を数え上げた.その結果,1)シリーズ作品の占める割合が年々増加し,現在は9割近くを占めること,2)それに対応して,売上上位に食い込むオリジナルタイトルが減少したこと,3)移植ものが減少したこと,4)版権ものが増加したこと,が明らかとなった.これらの結果から,現在の日本の家庭用ゲーム産業の活性化度は決して高くないと言うことが出来る.This paper reports the activity of the video-game industry in Japan. Using the top 100 sales data in 1996 - 2004, we counted up the number of titles which have such properties as the serial titles, original titles, transplanted titles, and gamized titles which have the original manga, anime, or novels. Results are: 1) the number of the serial titles is increasing yearly and more than 80% titles are the serial in 2004, 2) the original titles are decreased, 3) the transplanted titles are decreased, 4) the titles with original work are increased. It is apparent that the activity of the video-game industry in Japan is slowing down..
著者
加藤 圭介 野沢 和典 山下 洋一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告音声言語情報処理(SLP) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.124, pp.223-228, 2003-12-18

本報告では、日本人英語学習者の英文発話における韻律を自動評定する手法について述べる。学習者と英語母語話者の発話を比較し、基本周波数、パワー、発話長の類似度を算出して韻律パラメータとする。2つの発話を比較する際には単語や単語境界部などさまざまな比較単位ごとに比較し、比較単位による結果の違いを考察した。また、基本周波数とパワーに関してはパターン距離などの従来手法に加え、回帰曲線近似誤差を用いた評定手法を提案し、評定結果の妥当性を検証した。さらに、複数の韻律パラメータを組合せ、学習者発話の韻律を評定するモデルを作成した。In this paper, we describe techniques to score prosody of sentence speech uttered by English learners. Based on the comparison between learners' speech and native speaker's speech, we make prosodic parameters by calculating the similarity of learners' speech and native speaker's speech about F0, power and duration. The comparison is carried out every comparison unit, such as a word, a word boundary, and so on. We try a new scoring measure in terms of approximate error of regression fitting, as well as pattern distance, for F0 and power. Moreover, we make a multiple regression model for scoring prosody of English learners' speech by combining two or more prosodic parameters.
著者
副田 俊介 田中 哲朗
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ゲーム情報学(GI) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.79, pp.31-38, 2003-08-04

最中限は竹内郁雄によって提案された3人プレイヤのカードゲームである.本研究は最中限をプレイする強いプログラムを作ることを目的とする.最中限は提案されたばかりのゲームであるため,人間のプレイにおいても,有効な戦略は確立されていない.そこで,人間の知識を使わずに計算機を用いて最中限を分析することにより,有効な戦略を求めることを試みる.この目的のために,最中限をプレイするプログラムを自動対戦させる実験を行い,点数に注目して分析を行った.プログラムは途中まではランダムプレイ,最終ラウンドでは検索によって手を生成するものを用いた.このプログラムは最終ラウンドの検索では相手プレイヤがランダムプレイヤ,つまりどの手も等しい確率で選ぶプレイヤであると仮定して全幅検索を行っている.この実験の結果,最終ラウンドに入る時点で点数が最も高かったプレイヤのゲーム終了時の得点の期待値は -0.56,2番目のプレイヤは0.91,3番目のプレイヤは-0.54となり,最終ラウンドに入る時点で最も中間の位置にいるプレイヤが最も有利であるという経験則と,この条件の元では一致することが確かめられた.Saichugen is a three player card game introduced by Ikuo Takeuchi. As it is a fairly new game, no good playing strategies are well known yet for Saichugen. We have analyzed Saichugen endgames by using Saichugen playing programs. We have used programs that play randomly up to the middle of the game, and plays by searching in the last round of the game. The programs assumes that the opponents players play randomly when searching. We had this programs play each other for 1000 games and analyzed the results. For these playes. We were able to show that the player with the most middle points when entering the endgame tends to keep his place - win the game.
著者
大川 貴之 桜井 貴文 小谷 善行 辻 尚史
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告ゲーム情報学(GI) (ISSN:09196072)
巻号頁・発行日
vol.2002, no.27, pp.73-80, 2002-03-15
被引用文献数
2

2人ゲームではαβ法などにより枝刈りを行って、ゲーム木の中で読む場合の数を大幅に減らすことができるが、一般の多人数ゲームでは相手が複数で、複数のプレイヤーの有利不利が入り交じったりするので、2人ゲームと同じ方法で枝刈りを行うことはできない。 本論文では、各プレイヤーの評価値の和が一定であるという仮定を設けて、多人数ゲームにおける枝刈りを行う方法を考えた。多人数・零和・有限・確定・完全情報の条件を満たすゲームとして「四人将棋」がある。 本論文では、我々が考案した多人数ゲーム木の枝刈り法を実証するため、四人将棋をプレイするプログラムを作成し、実験を行った。In this paper, we study a pruning method which searches an multi-player game tree. We concentrate here on multi-player, zero-sum, deterministic, and perfect information games. In the case of two-player game, the alpha-beta technique is used to speed up the search of a tree by maintaining cutoff values. But it is not applicable to a multi-player game, since each player has more than one opponent. Here, we introduce a pruning method in searching a multi-player game tree. Moreover, we implemented a program that plays Yonin-shogi, and we show that the method introduced here is effective in the search of a game tree of Yonin-shogi.
著者
成澤 修一 峯松 信明 広瀬 啓吉 藤崎 博也
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.43, no.7, pp.2155-2168, 2002-07-15
被引用文献数
18 4

藤崎らによる音声の基本周波数パターン($F_0$ パターン)生成過程のモデルは,少数のパラメータから実測の $F_0$ パターンにきわめて近いパターンを生成しうることが知られており,音声合成に広く用いられている.一方,実測の $F_0$ パターンからモデルのパラメータを抽出することは解析的には解けない逆問題であり,初期値を与え逐次近似を行う必要がある.この場合,高精度のパラメータを迅速に抽出するには適切な初期値の設定が不可欠であるが,従来はこれを人手によって行っていたため,大量の音声資料の自動的処理は困難であった.本論文では,実測の $F_0$ パターンからパラメータの初期値を自動的に決定し,さらにそれに基づいて高精度のパラメータ抽出を自動的に行う手法を提案する.この手法は,実測された $F_0$ パターンをいたるところで連続かつ微分可能な曲線によって近似するための処理,得られた曲線からアクセント指令とフレーズ指令のパラメータの初期値を決定するための処理,さらにそれらの初期値をもとに逐次近似によりパラメータの最適値を求める処理,の3段階の処理からなる.共通日本語の男性・女性話者各1名の朗読音声を対象とした実験の結果,男性の朗読音声について,以前に提案された手法では,パラメータ抽出の性能として,指令の再現率78%,精度67%であるのに対し,提案手法によればそれぞれ82%,80%であった.また,女性の朗読音声については,従来手法では再現率60%,精度51%であるのに対し,提案手法ではそれぞれ83%,72%であった.この結果から,本手法の有効性が実証された.The model for the generation process of the fundamental frequency contours (F0 contours) of speech by Fujisaki et al. is known to be capable of generating F0 contours quite close to observed natural contours, and is widely used in speech synthesis. The extraction of model parameters from an observed F0 contour, however, is an inverse problem that cannot be solved analytically, and requires an iterative process starting from a set of initial parameter values. In order to guarantee a rapid convergence to an optimum solution, the process requires appropriate initial values. These initial values have usually been given manually, making it difficult to analyze a large amount of speech material. The present paper proposes a method for automatically extracting the parameter values from a given F0 contour. The method consists of three steps: approximation of an observed F0 contour by a curve that is continuous and differentiable everywhere, extraction of initial values for the parameters from the curve, and optimization of the parameters by successive approximation. Analysis of read speech material of common Japanese by a male speaker showed that the recall and precision rates of model command estimation reached respectively 82% and 80% by the proposed method, while the rates obtained by a previous method were 78% and 67%, respectively. The recall and precision rates obtained for a female speaker were respectively 83% and 72% by the proposed method, but were respectively 60% and 51% by the previous method. These results demonstrate the validity of the current approach.
著者
伊藤 毅志
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.50, no.9, pp.887-894, 2009-09-15
被引用文献数
4

多くの幸運が重なり,電気通信大学情報工学科伊藤研究室の開発した「文殊」は,第19回世界コンピュータ将棋選手権において,初出場で第3位という成績を残すに至った.この解説では,「文殊」の誕生までの歩みと文殊で行った「合議アルゴリズム」の技術的な工夫と,いくつかの実験結果について紹介する.
著者
安岡 素子 安岡 孝一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告人文科学とコンピュータ(CH) (ISSN:09196072)
巻号頁・発行日
vol.1996, no.42, pp.19-24, 1996-05-17
被引用文献数
1

「書」を対象とする書道・書法研究分野では、科学的手法を用いた分析というものが従来なされていない。この分野でよく用いられる表現である「重心」、「字間」、「行の揺れ」、「文字の大小変化」といったものも実際に定量化されることは全くなかった。本研究では、コンピュータを用いることによって「書」を定量的に分析することを目標とする。具体的手法としては、書の「重心」、「字間」、「行の揺れ」を数学的に定義し、その定義に従って書をコンピュータ処理する。本研究の手法は、入力データの形式等に依存しないものとなっており、書の分析において幅広い応用が可能である。There exist no previous works of scientific analysis on the field of calligraphology. Calligraphers often use the terminology such as "center of gravity", "interval of characters", "sway in line", or "differential of character sizes" without definitions of the terminology. In this paper, we show a method to analyze calligraphy quantitatively with the help of a computer. In other words, here we define "center of gravity", "interval of characters", "sway in line", and "differential of character sizes" as mathematical terminology, then we manipulate calligraphy on the mathematical point of view by a computer. Our method is independent of the designs of calligraphy themselves, therefore it is so widely applicable to analysis of calligraphy.
著者
今枝 恒治 河合 敦夫 石川 裕司 永田 亮 桝井 文人
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告コンピュータと教育(CE) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.13, pp.39-46, 2003-02-07
被引用文献数
2 6

本論文では,実際に日本語学習者の書いた作文を題材として,比較的書き誤る可能性の高い格助詞に対して,誤りの検出と訂正を行うシステムを構築した.この手法として,まずルールに基づいた処理をおこない,そこで検出・訂正できなかった誤りに対して,格フレーム照合をおこなう.格フレーム照合では,入力文の格フレームと辞書から得られる格フレームを比較することにより,誤りの検出および訂正をする.実験の結果として,75.6%の誤り検出率と,62.5%の誤り訂正率を得ることができ,本手法が,日本語学習者の書いた作文中の格助詞の誤り検出・訂正に有効であることを示すことができた.In this paper, we propose a method of detecting and correcting errors in usage of case particles in composition written by Japanese learners. The method has two major steps.In the first step, rules based on analysis of the composition detect and correct the errors. In the second step, a case frame dictionary is used to detect and correct the errors that the rules failed to detect. Those errors are corrected comparing the case frame of an input sentence with the case frames in the dictionary. As a result of experiments, 75.6% of rate of error detection and 62.5% of rate of error correction were obtained. The result shows that the method is effective to detect and correct errors of case particles in composition written by Japanese learners.
著者
大向 一輝
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.54, no.12, pp.1204-1210, 2013-11-15
被引用文献数
1

Webを通じたデータの積極的な公開・共有を目指すオープンデータを進めるにあたっては,ライセンスの選択やデータが作られる現場のワークフロー設計といった制度面における課題とともに,公開されるデータのフォーマットやアクセス方法などの技術面での検討が必要である.実際にオープンデータを利用するユーザの観点からは,入手が容易であり,処理のしやすいデータほど活用されやすい傾向にあると思われる.Web上に散在する多様なデータに対して統一的な手段でアクセスすることができ,そのデータが共通のルールに基づいて記述されているような環境の構築は,オープンデータの普及にとって重要な課題である.これに対して,文書の公開・共有手段として成功を収めたWebの技術的方法論をデータに適用するLinked Open Data(LOD)が注目されている.本稿ではオープンデータを支える技術としてのLinked Open Dataについて述べ,今後の展望について議論する.
著者
児玉 公信
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告情報システムと社会環境(IS) (ISSN:09196072)
巻号頁・発行日
vol.2008, no.81, pp.39-44, 2008-08-21

情報システムの機能要求を記述するために,ユースケースが一般的に使われるようになったが,その記述内容や粒度はまちまちであり,その意義も効果も十分に理解された上で使われているとは言えない.本報告では,行為者の仕事を 「もの・こと分析」 でいう 「基本変換」 としてとらえ,ユースケースを 「手段のもの」 として定義することを提案する.これによって,仕事の流れとユースケースおよびユースケース記述の位置づけが明らかになり,記述すべき内容を確定できる.Usecase has recently become a standard method of writing functional requirements for information systems. However, different styles and granularities are being used in dif ferent usecases because of misunderstandings regarding the meanings and benefits of the usecase method. This report proposes to treat the actions of an actor as the basic transftmnation of a "MONO-KOTO" analysis of Nakamura and to write usecase as a "THING of MEANS," a function to support the action. This treatment enables usecase writers to understand the usage of usecase and flow of actions while ensuring the provision of a good description of usecase.
著者
児玉 公信 水野 忠則
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.49, no.2, pp.902-909, 2008-02-15
被引用文献数
4

本論文は,生産管理領域の概念データモデル「CHARM(Cross Hierarchical Account Resource Model)」を提案する.本モデルは「勘定パターン」を骨格としており,会計領域で培われたベストプラクティスを生産管理領域にもたらす.これによって,未来在庫の把握および生産座席予約を合理的に扱うことができ,近年の日本の製造業における個別受注生産の比率の高まりにともなうさまざまな課題,すなわち製番に基づく生産計画,製品の個体管理,上流工程でまとめ作りした材料の引当て,原料から製品までのトレーサビリティの確保を実現できる.This paper proposes a new general model of the production management domain, the CHARM (Cross Hierarchical Account Resource Model). This model is based on the Account pattern. Inherent in the pattern are the best practices of the accounting field as applied to the manufacturing management area, enabling us to treat the inventory of the future and production seat booking reasonably. Therefore we can solve problems caused by the rise of the ratio of build-to-order in recent Japanese manufacturing. The problems primarily involve production planning, individual product management, manufacturing with accumulation in the upstream process, and ensuring the traceability from raw materials to products related to the seiban (manufacturing number).
著者
本田 新九郎 富岡 展也 木村 尚亮 大澤 隆治 岡田 謙一 松下 温
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.39, no.5, pp.1472-1483, 1998-05-15
被引用文献数
17

本稿では,3次元返想空間を利用した在宅勤務環境を提供する仮想オフィスシステムValentineについて述べる.Valentineは,地理的に分散したユーザをネットワーク上に仮想的に構築したオフィスに出勤させ,そこで他のメンバの雰囲気・気配を伝達し,コミュニケーションを支援するシステムである.物理的なオフィスは存在せず,ユーザはすべて仮想オフィスに通うことを想定している.遠隔地にいる他の社員の気配を伝達するために,「周辺視ビュー」および「効果音」を実現し,アウェアネスの提供を行った.またアウェアネスの過度な提供が効率的な個人作業の妨げとなることから,ユーザの「集中度」を定義し,集中度に応じたアウェアネス提供環境を実現した.集中度は「キーボード,マウスの利用頻度」「椅子を動かす頻度」という2つの要素からシステムで自動検出され,作業環境に反映される.評価実験を行った結果,気配の伝達および集中度に応じた環境の提供について,良好な結果を得た.In this paper,we describe a virtual office system named Valentine that provides a "work-at-home" environment based on 3D virtual space.Users can go to the virtual office built on network virtually,feel the existence of each other,and communicate with each other by using Valentine.We assume that we have no physical office and all members go to the virtual office.In order to transmit the feeling of other members' presence at the virtual office,we have realized "Around View" and "Sound Effect" for supporting awareness in Valentine.On the other hand,for avoiding too much awareness information that bothers workers,we have defined "degree of concentration" and provided appropriate office environment to workers according to their state.The degree of concentration is automatically detected from two elements "the frequency of key stroke and mouse use" and "the frequency of rotating a chair".The system evaluation demonstrated that we have gained a better result on transmitting the presence and providing an environment according to the degree of concentration.
著者
三井 一平 内田 誠 白山晋
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告知能と複雑系(ICS) (ISSN:09196072)
巻号頁・発行日
vol.2006, no.2, pp.17-24, 2006-01-12
被引用文献数
4

多くのネットワークモデルが提唱されているが,ほとんどが人同士の繋がりのみをモデル化したものである.しかし,社会的ネットワークは,人同士の繋がりだけでなく,人と社会的コミュニティとの関係によっても規定される.例えば,SNSにおいては,コミュニティと呼ばれるグループが存在し,ネットワーク形成に重要な役割を果たしている.また,近年,いくつかのネットワークにおいて明らかにされつつある潜在的なコミュニティ構造にも影響しているものと考えられる.本研究では,SNSのコミュニティを陽なコミュニティ構造と考え,これを有するネットワークに対して,局所的・全体的な相互作用を考慮した,ネットワーク成長モデルを提案する.In the fleld of complex network research, many network models have been proposed, but most of them focused on modeling of link structure among each individual. On the contrary, social networks are composed not only of such individual links but also of social communities. For example, one of the main functions on SNS is the Community, which is like SIG (Special Interest Group) and also is explicit community. It is considered that the community in SNS will play an important role in formation of the network. Besides, this community may affect inherent community structure that has been found in some networks. In this paper, we focus on this community, and propose an evolving network model in an explicit community.
著者
湊 真一
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.54, no.11, pp.1152-1159, 2013-10-15

「おねえさんの問題」と呼ばれる格子グラフ上の経路数え上げ問題が,アルゴリズムの専門家のみならず,情報処理関連の研究者・技術者の間でも広く注目を集めている.本稿では,まず「おねえさんの問題」という名称の由来について述べ,この問題を効率よく解くためのデータ構造「ZDD」とKnuth のZDD 構築アルゴリズムについて簡単に解説する.次に,この問題が知られるきっかけになった日本科学未来館における研究成果展示とYouTube 動画の反響について振り返り,最近達成された世界記録の状況について述べる.最後に,この問題が高速に解けることで今後どのような応用が期待できるかを展望する.
著者
関 洋平 原田 賢一
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告デジタルドキュメント(DD) (ISSN:09196072)
巻号頁・発行日
vol.2001, no.120, pp.25-32, 2001-11-30
被引用文献数
2

近年,日本を中心として携帯端末上の情報提示を目的とした応用が盛んである。本研究では,そのような応用の一つとして,コラム記事から経済の流れをコンパクトに提示するための要約手法について提案する。また,文字数を考慮した個々の文の圧縮手法を提案する。実際の要約処理は,まず,要約に際して必要となる数値情報について考察し,重要文抽出を行った。続いて,その文に対して構文解析を行い,不必要と判断される形態素や句を除去した。構文構造はXML形式でタグ付けを行う。最後に,XSLT(Extensible Stylesheet Language Transformation)を使用して構文木の親子関係に対して制約を与えることにより,構造の圧縮を行った。結果の出力にあたっては,WML(Wireless Markup Language)を使用した。In these years, many applications on portable phones have been developed. We implement the experimental system for summarizing column articles to present economic information for office workers. It is based on character-number based size constraints. Our summarization process is as follows: at first, we set some nuneric criteria to extract important sentences. Second, those extaracted sentences are syntactically parsed and unnecessary phrases are removed. The syntax structure is tagged with XML-formalism. At last, we use XSLT technique and compress those structure based on syntactic tree constraints. The output of this experimental system is demonstrated on the portable phone by using WML(Wireless Markup Language).
著者
飯田浩史 岡崎博樹 上林憲行
出版者
一般社団法人情報処理学会
雑誌
全国大会講演論文集
巻号頁・発行日
vol.2011, no.1, pp.221-223, 2011-03-02

現代には過去・現在・未来を表す様々なツールやサービスがあふれているが,現代人はスケジュールに振り回され時間に管理されている.この時間に管理されるという立場ではなく,様々な出来事に対して予定を待つ喜び,思い出から懐かしさを抱いてもらえるようにする.そこで本研究では様々な面で表現・開発の自由度が高いiPhone上で,過去・現在・未来を混在させたタイムサービスを作成した.このサービスではシャボン玉の色や大きさで予定を直観的に把握できるバブル型と,今までのように入力した予定を一覧表示できるリスト型の2つのユーザインターフェースを実装している.
著者
木俵 豊 是津耕司 河合 由起子 水口充 宮森 恒 柏岡 秀紀
出版者
一般社団法人情報処理学会
雑誌
情報処理 (ISSN:04478053)
巻号頁・発行日
vol.50, no.7, pp.613-623, 2009-07-15
被引用文献数
1

ライフログはユビキタスネットワーク・コンピューティング環境における新たな情報利活用技術の情報源となりつつある.ライフログは実世界におけるユーザの行動履歴を記憶の拡張として活用されている.ウェアラブルコンピュータを使って,ユーザの周りのさまざまな情報を取得する手法も提案されているが,このような情報は意図せぬ他人の情報を取得してしまうこともあり,プライバシの問題なども発生している.一方,ディジタルコンテンツを実世界で利用する場合の情報端末の操作や音声による発話および対話記録もライフログとして重要な情報源である.これらは,ユーザごとの興味に基づいた実世界のイベントや特徴を表現していることが多く,実世界アノテーション情報としても有益である.つまり,有効なライフログとして活用するためには,その情報の生成・発信,管理,分析,提示する技術開発が重要となる.本稿では,実世界におけるコンテンツ利活用に着目したライフログの活用について述べる.
著者
梶 博行 相薗 敏子
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.42, no.9, pp.2248-2258, 2001-09-15
被引用文献数
1

対訳辞書は機械翻訳システムや多言語情報検索システムの重要な構成要素である.基本対訳辞書の増補や専門用語対訳辞書の作成を自動化することを目的として,対訳コーパスから語の対訳関係を抽出する新しい方法を開発した.本方法は,コーパス中で共起している語の集合で語を特徴付け,共起語集合の類似度が高い語のペアを対訳語ペアとして抽出する.異なる言語の語を構成要素とする共起語集合の類似度を計算するため,既存の対訳辞書を参照して対訳関係が成立する語を対応付ける.共起語集合の類似度計算という統計処理の中で既知の対訳知識を利用することにより,次の長所をあわせ持つ方法が実現できた.第1に,文レベルの対応付けがなされていない対訳コーパスに適用可能である.第2に,小規模な対訳コーパスから対訳語ペアを抽出することができる.第3に,未知語を含む単純語と複合語の任意の組合せの対訳語ペアを抽出することができる.日英対訳の特許明細書コーパスを用いて,既存の対訳辞書(50 000語の見出し語を持つ日英機械翻訳システムの対訳辞書)に未登録の対訳語ペアを抽出する実験を行った.33.8%の抽出率,76.7%の正解率を達成し,提案方法が実用に供しうるとの結論を得た.本方法は,大規模な対訳コーパスを要求せず,対訳文書を個別に処理していけばよいので,実際的である.今後の課題として,コーパスからの複合語抽出精度を向上させることがあげられる.A new method has been developed for extracting pairs of words that are translations of each other from a parallel corpus. First, for each word of both languages, the set of words co-occurring with it is extracted from the corpus. Then, the similarity between each pair of co-occurring word sets, one for a word of the first language and the other for a word of the second language, is calculated with the assistance of an existing bilingual dictionary of basic words. Finally, pairs of words that bear much similarity are selected. The method has the following features due to the combined use of co-occurrence information given by a corpus and bilingual knowledge given by an existing dictionary. It can extract word translations from rather small, unaligned corpora; it can extract a variety of word translations including pairs of simple words, pairs of compound words, and mixed pairs of simple and compound words. An experiment using Japanese-English patent specification documents achieved 33.8% recall and 76.7% precision; this demonstrates that the method is useful both for improving the coverage of an existing bilingual dictionary and for creating a bilingual dictionary of technical terms. A further problem is to improve the method for extracting compound words from corpora.