著者
池澤和希 浦谷則好
雑誌
第77回全国大会講演論文集
巻号頁・発行日
vol.2015, no.1, pp.191-193, 2015-03-17

歌はいつの時代も人々の関心を集め続けている。人間と常に寄り添って歩んできた歌を調べることにより社会学的に有用な人の動向、興味を調べることが可能となる。本研究では歌を形成する要素である歌詞の特徴や傾向を分析し可視化することを目的とする。 まず、共起ネットワークを用いてそれぞれの歌詞の語の特徴を分析、図にマッピングすることで作詞家の特徴を明確にする。対応分析を行い作詞家間の類似度を可視化する。さらに、歌詞から年代を推定し、時代背景との関連を考察する。
著者
塩崎浩二 浦谷則好
雑誌
第74回全国大会講演論文集
巻号頁・発行日
vol.2012, no.1, pp.29-30, 2012-03-06

映画の国内公開累計数は4万本にも及ぶ。見たい映画を探す時、既存の検索システムでは、入力した映画と同じジャンル、あるいは同じ製作年代のものが提示されることがほとんどである。本研究は、Webページの情報から映画のあらすじを取得してデータベース化し、お気に入りの1本の映画のあらすじから、関連性の強いお勧め映画を推薦するものである。検索には連想検索エンジンGETAを使い、あらすじのマッチングを取る。また、監督名、主演俳優名からも映画を検索することができる。関連映画として同シリーズ、同監督作品などを合わせて10作品程度提示する。1本の映画から枝を広げて様々な映画を検索することができる。
著者
森元 逞 田代 敏久 竹澤 寿幸 永田 昌明 谷戸 文廣 浦谷則好 鈴木 雅実 菊井 玄一郎
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.37, no.9, pp.1726-1735, 1996-09-15
参考文献数
21
被引用文献数
5

日本語から英語へ翻訳可能な音声翻訳実験システム(ASURA)を開発した. ASURAでは 分野間の移植性を確保できるよう 一般的な日本語話し言葉の表現を網羅するとともに 音声認識と言語翻訳のコンポーネントのいずれも 名詞や動詞などの分野に依存する辞書項目を容易に入れ替え可能な構成としている. また 音声認識や言語翻訳にともなって発生する暖昧さ(複数の候補)に対処するため 正しい候補を効率良く選択できるようにコンポーネント間 サブコンポーネント間で機能分担を行い また候補の探索メカニズムを組み込んでいる. 本論文では このようなASURAのシステム構成について述べ また システムの性能評価を行い このシステム構成の有効性を示す.We have developed the experimental speech translation system ASURA, which translates from Japanese to English. In order to keep high portability to various domains, most of the common expressions in spoken Japanese are covered, and both the speech recognition and language translation components are constructed so that domain-dependent lexical items such as nouns and verbs are easy to replace. Furthermore, all of the components and sub-components in the system share functionalities so that they can effectively reduce ambiguities created in the course of speech recognition and language translation processing. The candidate search mechanisms are also incorporated for the same purpose. This paper describes the configuration and performance evaluation of the system, and demonstrates the effectiveness of the configuration.
著者
後藤 功雄 加藤 直人 田中 英輝 江原暉将 浦谷則好
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.47, no.3, pp.968-979, 2006-03-15
参考文献数
22

カタカナで表記された外国人名の英訳語を,関連語をキーワードとする言語横断情報検索と,発音類似性を利用した訳語推定により,World Wide Web(WWW)文書から獲得する手法を提案する.ニュース記事に出現する人名は新出語であることが多く,対訳辞書に登録されていない場合も多い.提案手法は,カタカナの外国人名が文書中に存在した場合,はじめにその周辺の単語を対訳辞書によって英訳し,これらをキーワードとして英語のWWW 文書検索を行う.次に,検索されたWWW 文書中から人名候補となる英単語列を翻字により変換し,発音が類似した英単語列を訳語とする.ニュース記事に出現した外国人名を対象として本手法による実験を行い,有効性を確認した.This paper proposes a method of acquiring English equivalents of foreign personal names written in katakana characters from the World Wide Web (WWW). In news articles, new foreign personal names appear frequently and are rarely registered in bilingual dictionaries. Our method can automatically obtain the English equivalents of personal names by using two phases: cross-language information retrieval using related words and acquisition of translation based on phonetic similarity. In the first phase, given a katakana foreign personal name appearing in a news article, the method extracts words related to the foreign personal name, translates these words into English using bilingual dictionaries, and retrieves WWW documents in English using the translated words as keywords. In the second phase, our method extracts candidates of English equivalents from the retrievedWWWdocuments, transliterates the candidates to phonetic expressions, compares them with the phonetic expression of the personal name written in katakana, and obtains the most similar one as the English equivalent. We confirmed the effectiveness of our method with a series of experiments using foreign personal names appearing in news articles.
著者
浦谷則好 柴田 正啓 野□ 英男 相沢 輝昭
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.28, no.7, pp.758-767, 1987-07-15
被引用文献数
17

放送分野では膨大な数の静止画が番組制作の重要な素材として活用されている.扱う画像は多種多様であり 新規の入力も頻繁なので検索データの更新は迅速かつ簡便なことが必要となる.そこで我々はキーワード検索を基本とした高速でコンパクトな静止画検索システムFORKS(Flexible Online Retrieval by Keyword Sequence)を試作した.キーワード検索には通常逆ファイルが用いられるが FORKSでは順ファイノレ形式のみによるデータ管理方式をとりながら データ構造の工夫と専用ハードウェアによって高速な検索 並びにデータ更新を可能にした放送用途を考えて約2 000のキーワードを選定し それらを70のグループに分け それぞれを概念の上下関係にしたがって木構造の形で体系化した.これによってシステムのキーワード管理を容易にし 同時に 利用者のキーワード指定を簡単にした.さらに蓄積時および検索時のガイド画面をネットワーク構造を用いて制御することによって再現率のよい自由な観点からの検索を実現した.最終的な画像を対話的に選択するのに便利な静止画と関連文字情報の連動表示や 想定されるエンドユーザによる試用実験の結果についても述べた.
著者
浦谷則好
出版者
一般社団法人情報処理学会
雑誌
情報処理学会論文誌 (ISSN:18827764)
巻号頁・発行日
vol.30, no.9, pp.1119-1125, 1989-09-15
被引用文献数
1

コンピュータによる文書処理にとって文字列の照合は最も基本的な操作である.文書処理の高速化への寄与が大きいので 効率の良い照合手法が求められている.パターンが1つの場合にはBoyer-Moore法が最も効率の良い手法として知られているが この方法では複数パターンを同時に照合することはできない.複数パターンを同時に照合する方法としてはAho-Corasick法が有名であるが 効率は Boyer-Moore 法より劣る.筆者らは「パターンの後方からの照合」というBoyer-Moore法の基本的なアイデアと 「パターン照合機械による照合」というAho-Corasick法の基本的なアイデアを結合して FAST法(A Flying Algorithm for Searching Terms)を考案した.FAST法では複数のパターンを同時に効率良く照合することができる.この輪文ではFAST法の基本的な発想と具体的なアルゴリズムについて述べる.FAST法の効率についても考察し 実験による結果も示す.文字種が多いときやパターンが長いときには高い照合効率が得られることを確認した.例えば パターン長が2と短くても文字種が94のときには パターン数60以下ではAho-Corasick法より効率がまさっている.また この方法は多大なメモリを必要とする欠点を有しているが この軽減方法についてもふれた.