著者
佐々木 稔
出版者
The Iron and Steel Institute of Japan
雑誌
鉄と鋼 (ISSN:00211575)
巻号頁・発行日
vol.68, no.1, pp.178-184, 1982-01-01 (Released:2010-01-19)
参考文献数
6
被引用文献数
2
著者
新納 浩幸 浅原 正幸 古宮 嘉那子 佐々木 稔
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.24, no.5, pp.705-720, 2017-12-15 (Released:2018-03-15)
参考文献数
13
被引用文献数
8

我々は国語研日本語ウェブコーパスと word2vec を用いて単語の分散表現を構築し,その分散表現のデータを nwjc2vec と名付けて公開している.本稿では nwjc2vec を紹介し,nwjc2vec の品質を評価するために行った2種類の評価実験の結果を報告する.第一の評価実験では,単語間類似度の評価として,単語類似度データセットを利用して人間の主観評価とのスピアマン順位相関係数を算出する.第二の評価実験では,タスクに基づく評価として,nwjc2vec を用いて語義曖昧性解消及び回帰型ニューラルネットワークによる言語モデルの構築を行う.どちらの評価実験においても,新聞記事7年分の記事データから構築した分散表現を用いた場合の結果と比較することで,nwjc2vec が高品質であることを示す.
著者
新納 浩幸 佐々木 稔
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.20, no.5, pp.707-726, 2013-12-13 (Released:2014-03-13)
参考文献数
29
被引用文献数
3 4

本論文では語義曖昧性解消 (Word Sense Disambiguation, WSD) の領域適応に対する手法を提案する.WSD の領域適応の問題は,2 つの問題に要約できる.1 つは領域間で語義の分布が異なる問題,もう 1 つは領域の変化によりデータスパースネスが生じる問題である.本論文では上記の点を論じ,前者の問題の対策として学習手法に k 近傍法を補助的に用いること,後者の問題の対策としてトピックモデルを用いることを提案する.具体的にはターゲット領域から構築できるトピックモデルによって,ソース領域の訓練データとターゲット領域のテストデータにトピック素性を追加する.拡張された素性ベクトルから SVM を用いて語義識別を行うが,識別の信頼性が低いものには k 近傍法の識別結果を用いる.BCCWJ コーパスの 2 つの領域 PB(書籍)と OC(Yahoo! 知恵袋)から共に頻度が 50 以上の多義語 17 単語を対象にして,WSD の領域適応の実験を行い,提案手法の有効性を示す.別種の領域間における本手法の有効性の確認,領域の一般性を考慮したトピックモデルを WSD に利用する方法,および WSD の領域適応に有効なアンサンブル手法を考案することを今後の課題とする.
著者
新納 浩幸 佐々木 稔
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.21, no.5, pp.1011-1035, 2014-09-16 (Released:2014-12-16)
参考文献数
28
被引用文献数
1

本論文では語義曖昧性解消(Word Sense Disambiguation,WSD)の教師なし領域適応の問題に対して,共変量シフト下の学習を試みる.共変量シフト下の学習では確率密度比 w(x) = PT(x)/PS(x) を重みとした重み付き学習を行うが,WSD の場合,推定される確率密度比の値が小さくなる傾向がある.ここでは PT(x) と PS(x) をそれぞれ求めて,その比を取ることで w(x) を推定するが,PS(x) を求める際に,ターゲット領域のコーパスとソース領域のコーパスを合わせたコーパスを,新たにソース領域のコーパス S と見なすことで,先の問題に対処する.BCCWJ の 3 つの領域 OC (Yahoo! 知恵袋),PB(書籍)及び PN(新聞)を選び,SemEval-2 の日本語 WSD タスクのデータを利用して,多義語 16 種類を対象に,WSD の領域適応の実験を行った.w(x) を推定する手法として,PT(x) と PS(x) を求めずに,w(x) を直接推定する uLSIF も試みた.また確率密度比を上方修正するために「p 乗する」「相対確率密度比を取る」という手法も組み合わせて試みた.それらの実験の結果,提案手法の有効性が示された.
著者
佐々木 稔 SASAKI Minoru
出版者
名古屋大学文学部
雑誌
名古屋大学文学部研究論集. 文学 (ISSN:04694716)
巻号頁・発行日
vol.63, pp.31-53, 2017-03-31

Cʼest dans le numéro de juin 1850 de Le Magasin des familles, revue de foyer, que pour la première fois après la révolution de février, Baudelaire publie deux poèmes tirés de Les Limbes, recueil en projet. Le premier de ces poèmes intitulé « Châtiment de lʼorgueil », raconte une anecdote où un théologien, enivré de sa dialectique, perd sa raison en punition de son orgueil. Certes, lʼhistoire a pour source un récit allégorique du Moyen-Âge, mais le poème est directement inspiré dʼun article philosophique qui accuse le socialisme de Proudhon de la révolution. Malgré cela, il est peu probable que ce soit un reproche adressé à la pensée de Proudhon. On est ainsi amené à supposer que Baudelaire blâme les utopistes des années 1830 et 1840. Mais les pièces publiées en diptyque sont contradictoires car le second poème, « Le vin des honnêtes gens », est justement inspiré des pensées utopistes. En parcourant les critiques littéraires de Baudelaire sous la Seconde République, on voit quʼen se référant à la philosophie proudhonienne, le poète fait lʼéloge des ouvriers, en même temps quʼil condamne les démagogues qui conduisent le peuple à la banqueroute. Cʼest ainsi que « Le vin des honnêtes gens » symbolise la poétique de lʼivresse qui sous-entend lʼadmiration pour les pauvres travailleurs, tandis que « Châtiment de lʼorgueil » présente la perspective circonscrivant les idées politiques de Baudelaire à cette époque. Cʼest pourquoi ces deux poèmes correspondent parfaitement au sujet de Les Limbes qui traduisent « les agitations et les mélancolies de la jeunesse moderne ».
著者
星 秀夫 佐々木 稔
出版者
The Iron and Steel Institute of Japan
雑誌
鉄と鋼 (ISSN:00211575)
巻号頁・発行日
vol.91, no.1, pp.103-107, 2005-01-01 (Released:2009-06-19)
参考文献数
4
被引用文献数
2 4

供試材である日本刀の三振りを切断し多くの項目について調査した結果,炭素以外の諸元素が極めて少ない高純度の炭素鋼であることが鍛接性を良くし耐食性を高め,また刀身全表面に圧縮残留応力をもたせることが日本刀の靱性をさらに強化すること等が確認できたことである.
著者
新納 浩幸 村田 真樹 白井 清昭 福本 文代 藤田 早苗 佐々木 稔 古宮 嘉那子 乾 孝司
出版者
一般社団法人 言語処理学会
雑誌
自然言語処理 (ISSN:13407619)
巻号頁・発行日
vol.22, no.5, pp.319-362, 2015

語義曖昧性解消の誤り分析を行う場合,まずどのような原因からその誤りが生じているかを調べ,誤りの原因を分類しておくことが一般的である.この分類のために,分析対象データに対して分析者 7 人が独自に設定した誤り原因のタイプを付与したが,各自の分析結果はかなり異なり,それらを議論によって統合することは負荷の高い作業であった.そこでクラスタリングを利用してある程度機械的にそれらを統合することを試み,最終的に 9 種類の誤り原因として統合した.この 9 種類の中の主要な 3 つの誤り原因により,語義曖昧性解消の誤りの 9 割が生じていることが判明した.またタイプ分類間の類似度を定義することで,統合した誤り原因のタイプ分類が,各自の分析結果を代表していることを示した.また統合した誤り原因のタイプ分類と各自の誤り原因のタイプ分類を比較し,ここで得られた誤り原因のタイプ分類が標準的であることも示した.
著者
星 秀夫 佐々木 稔
出版者
社団法人日本鉄鋼協会
雑誌
鐵と鋼 : 日本鐡鋼協會々誌 (ISSN:00211575)
巻号頁・発行日
vol.91, no.1, pp.103-107, 2005-01-01

Following research into methods for making practical use of Japanese swords, the following points were noted, (1)Upon examination of the forging face, it was found that the microstructure, hardness, and residual stress differed (2) In order to discover more about clad forging, a pre-heat treatment of the full annealing process was necessary (3) Especially in the core steel, non-metallic inclusion was noted in the area of the sharp side of sword (4)Upon examination of sample A, B, and C, all were found to contain pure material, the sample C however had high amount of Ti, Ca and V (5) Ordinary a core hardness of Hv 200 is obtained by addig O 1% C while quenching, however, an edge hardness of Hv 700〜800 can be easily obtained by the addition of 0 5〜0 6% carbon (6) Compared to other research materials, sample C had a low residual stress after compressive stress, however, sample C showed signs of past tempering and grinding that may account for the low residual stress It is assumed not to be an error in measurement (7) Upon examination of the microstructure, the central portion of the sword showed overheating in low carbon steel ferrite Follow-up research on old and new sword should include the traditional Japanese sword virtues of strength, cutting ability, and flexibility
著者
佐々木 稔 新納 浩幸
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2007, no.76, pp.109-114, 2007-07-25

ディレクトリ型の検索サービスはあらかじめ Web ページが項目別にまとめられているので、初心者でも簡単に WWW (World Wide Web) 検索をすることができる。このようなサービスを運営する側は Web ディレクトリへのサイト登録や分類、管理といった作業を人手により行っているため、膨大な Web ページを処理することが困難となる。そのため、我々は人手で行っている Web ディレクトリの管理作業を自動化するシステムの構築を目指している。これまで、サイトの内容語を扱わず、ホームページに記述された meta タグの name 属性値である keyword と description をキーワードとして階層のトップレベルで分類を行い、その結果として分類精度が 82% となり、本文を利用した場合の 55% を大幅に上回る分類性能を得ることができた。本稿では、これまでトップレベルで行っていた分類を拡張し、ディレクトリ階層全体を対象として Web サイトを分類する手法について述べる。階層構造全体を対象とすることで、より現実的で、実用的な Web ディレクトリの構築を行うことが可能となる。階層的な分類においても keyword、description 属性値をキーワードとして利用することの有効性を確かめるために、未分類のデータを利用して実験を行った結果、meta タグのみをキーワードとして利用したシステムは平均 62.7% の分類精度を得ることができた。比較として、meta タグを使わずに HTML 文書の本文を利用した場合の分類結果を求めると 42.3% であった。これより、階層的な分類においても HTML 文書の本文を利用するより meta タグのみを利用した方が有効であることが分かった。また、平均精度が 60% を超えていることから、半自動での Web ディレクトリの構築が可能であると考えられる。A web directory is a directory on the World Wide Web. For example, Yahoo! Directory and Dmoz are well known web directories. Some categories have a lot of web site links across an extensive range of topics. So we browse the categories below to find helpful resources and information. The web directories are created and maintained by human volunteers who are experts in particular categories. So many submissions of registering URLs are delayed due to not selecting the most specific category for them. In our research, we construct a system of automatic classification into a web directory which is maintained by human. In former experiments, the keywords and the description value of the meta tag in HTML documents are very efficient for Web site classification and the effects of the common words cause misclassification of Web sites. In this paper, we describe a classification system for hierarchical web directory structure. Using the whole directory hierarchy, we consider that the system enables to construct a practical and useful web directory. To evaluate the efficiency of this system based on the values of meta tag, we make an experiment on classifying web sites into the Dmoz directory using the web site registered in the Yahoo! directory. As the results of these experiments, the average precision using meta tag is about 62.7% and that using text of HTML document is about 42.3%. The precision using meta tag is higher than using text and we find the efficiency of the meta tag in the hierarchical classification as well as the classification to flat categories.
著者
佐々木 稔 新納 浩幸
出版者
一般社団法人情報処理学会
雑誌
情報処理学会研究報告自然言語処理(NL) (ISSN:09196072)
巻号頁・発行日
vol.2003, no.23, pp.145-152, 2003-03-06
被引用文献数
3

本稿では,文書要約の支援を目的としたシソーラスの自動構築を行うために,大規模な単語集合に対するクラスタリング手法の提案を行う.これまでの単語クラスタリングに関する研究は,索引語・文書行列を利用してさまざまな要素間類似度やアルゴリズムを用いてクラスタリングが行われている.この索引語・文書行列を利用した場合,索引語の分布はどのような文書内容で出現するかを統計的に示したもので,文書内における語と語の間にある意味的なつながりはそれほど強くない.そのため,結果として出力されるクラスタにはある話題に共通する単語が集まりやすくなると考えられる.意味的につながりを持つクラスタを構築するために,共起関係を持つ単語の組を抽出し,ある単語に対して意味的につながりやすい単語を統計的に表現し,それをクラスタリングすることで意味的な共通性を持つクラスタの自動構築を目指す.In this paper, we propose a new clustering algorithm for large scale document size to construct the thesaurus automatically in aid of summarization. The existing word-clustering systems use various similarity and clustering algorithm based on the context of the information retrieval. In case of the clustering using term-document matrix, the distribution of the index word represents the frequency of the word appearance in a certain contents of a document. Therefore, semantic relation between these words in the document is not so strong. As a result, the words which appear frequently in the contents tend to be gathered for one cluster. To construct a cluster set in which semantic relation between these words is contained, we show a word clustering using a pair of words with cooccurrence relation automatically. We further show that our clustering is effective for word sense disambiguation in comparison with using term-document matrix.