MORIOKA Tomohiko (@CHISE_ja)

投稿一覧(最新100件)

(CONLL-U 形式っぽいものも返してくれるようになったが、「UDに基づいて係り受け解析してCONLL-U 形式で返して」って頼んでも形態素解析しかしてくれないし、日本語ベースなので、https://t.co/wbzBzAkidJ を作った時の最初のプロトタイプに近い感じ)
@mandel59 @component なお、ここで、<pred> は IDC の character name から取った位置述語名です。cf. https://t.co/EhbqdhCQW0 の表3の述語に対応しますが、この表の述語名(RDF/IPLD版)はちょっと単純化されてて、S 式版だと surround-from-upper-left みたいな感じになります。
(あと、岡田さんの https://t.co/3MIRM9hark は CHISE などの古辞書の注文のセマンティクスを記述したグラフにくっつけようとした場合に問題があるので、この修正のための用件整理や修正案をまとめたいところだが、これはそのうち李媛さんがやりそうな気もする)
( https://t.co/Iki99XzG29 1960年1月に稼働した最初のマルス(マルス1)はコンピューター(プログラム内臓型)ではなく専用ハードウェアだったんだな。ストレージは磁気ドラム。駅員がキーボード不慣れだろうってことでテレタイプ端末使わずにパタパタ用専用端末を作った 訳なのか)
(昔白須さんが書いた割注・注疏のエンコードに関する文章がふと目に入り読み直してみたり https://t.co/KpMmANaaUZ )
「沈黙を破る : 新自由主義化する大学の‟隠された傷” 」 https://t.co/4qhStClQmg 胸がしめつけられるような論文だった。
([memo] 地域方言における変異形の併存状況 : 同化や混交 形に見られる単純化の方向 https://t.co/4yh5qWDHQ9 ); 「きやへん」というのは多分「ア音接続」なんだな。
([memo] 京阪神における狭母音の無声化 https://t.co/1HpsKl4Kbx )
(https://t.co/wbzBzAkidJ を読み返したところ、最初は6階層品詞体系を使ってたみたいだが、https://t.co/fnBsMXRyGW の段階では4階層になってる(但し、この時点では山崎品詞体系になっていない)。4階層にしたのは確か学習時になぜか MeCab がセグメンテーションフォールトしたからだった気がw)
(https://t.co/wbzBzAkidJ を読み返したところ、最初は6階層品詞体系を使ってたみたいだが、https://t.co/fnBsMXRyGW の段階では4階層になってる(但し、この時点では山崎品詞体系になっていない)。4階層にしたのは確か学習時になぜか MeCab がセグメンテーションフォールトしたからだった気がw)
(ちなみに、IWDS-1 を等式の集合とみなすと項書き換え系を用いて形式化できる。このネタに関しては https://t.co/nwRjtxuYyh で書いたが、私が TRS 専門じゃないのと査読意見の影響もあって肝心の形式化の部分に関しては白須裕之氏の「漢字構造の代数的記述についての予備的考察」も併読すべし)
(そういえば、大昔に聞いたモデル生成型定理証明 https://t.co/477uX6VQPV との関係もちょっと気になったのだった)

20 0 0 0 OA 大字典

(HNG の大字典の4658 https://t.co/tNdiPRizb7 が国デコの https://t.co/sT9wj3gWrQ と食い違っていることに気づく。もしや版違いかとも思ったが、スキャン時のファイル名の付け間違え+字種データは紙で作業しつつマッピングデータはスキャン画像を見て作業したと判断すると辻褄が合う感じ)
(HNG の再生と保存に関して書こうと思うんだけどどうも筆が進まない。https://t.co/Bj8wSzoDFG では COE の時の反省(と言い知れない怒りと悲しみ)に基づいて HNG についても外からの視点で書けたのだが)
(まあ、でも、考えてみれば、古典中国語の形態素解析器が割と実用的に使えるようになってるのは、最初のネタ発表 https://t.co/wbzBzAkidJ の時のことを思うとびっくりなのだが、気がつけばもう10年もやってることもびっくりである。月日が経つのは早い)
([memo] 池田証壽「漢字字体史の資料と方法 : 初唐の宮廷写経と日本の古辞書」 https://t.co/VceX8gps8d 池田先生達が何故古辞書の研究をされているのか遅ればせながらようやくちょっと理解できたかも知れない。(^_^;;;)
(昨日は(準備不足もあって)『漢字部品とは何か』という概念的な話に絞って話をしたのだが、一部でそれなりにウケたみたいなのでまあ良かったということにすべきか。個人的にはこれと包摂規準の TRS による形式化と『完備な包摂記述』概念の導入 https://t.co/nwRjtxMzpP で概念整理ができた感じ)
[memo] 田嶋 一夫「日本語情報処理における文字セットコントロールシステム」(1983) https://t.co/TQ22sZhe2Z 管理者(コントロール)は要らんかったのだと思う(必要なのはプロトコル(人間間も含めた)とデータ(コーパス))。で、それを大規模に実証したのが GlyphWiki といえようか。
(情報処理学会論文誌の人文科学とコンピュータ特集号が出たらしい。私の単著の「項書き換え系を用いた漢字字体の包摂規準の形式化の試み」 https://t.co/nwRjtxuYyh (ページ数(料金)が増えて悲しみ)と共著者の「古典中国語(漢文)の形態素解析とその応用」 https://t.co/uKdxdSyTi1 も載った)
(情報処理学会論文誌の人文科学とコンピュータ特集号が出たらしい。私の単著の「項書き換え系を用いた漢字字体の包摂規準の形式化の試み」 https://t.co/nwRjtxuYyh (ページ数(料金)が増えて悲しみ)と共著者の「古典中国語(漢文)の形態素解析とその応用」 https://t.co/uKdxdSyTi1 も載った)
(「データを生み出すデータのために」https://t.co/Bj8wSzoDFG を読み直してみたのだが、9年前の時点でもう少ししたら GPU を利用した AI やパターン認識ブームが来ることを示唆してて未来予測としては割と良い線行ってたなと思ったり(自画自賛w)。ただ、課題の達成度を考えるとうむむ)
RT @Cafejiaguwen: 『国語科教育』が、J-STAGEで公開された模様。『謎の漢字』の103頁でも紹介されていた、村内英一「漢字の字体に関する問題ー書取の正誤判定の限界」も見られるようになりました。手偏のハネについての言及があります。https://t.co/Og…
(拓本文字データベースの問題点(京大人文研の拓本コレクション中の偽拓の問題)に関しては https://t.co/iz8qI2LmcU で安岡さんご自身が指摘されているが、多分、全面改訂は無理なので、外側にアノテーションのシステムを作るしかないと思われる)
( https://t.co/wk7rJ03EP3 は20世紀末の電子図書館の話題や東洋学でのコンピューター利用の様子が垣間見える。前者の話を見るとなんというか当時の課題があまり片付いてないことに気づかされる。後者の話題の古びてる感じと対照的)
( https://t.co/RJEoA6LTRZ には謝清俊先生の部品ベースの漢字表現(私がCDPデータベースなどと呼んじゃったやつ)の論文や豊島先生による JIS X 0208:1997 の編集方針の話があって何気に資料価値が高い感じ。当時のWWWでの中国語への取り組み等も)
( https://t.co/z2iiVkw0pV には勝村さんや安岡夫妻や坂村健さんとかが1990年代の(今となってはやや的外れな)Unicode 批判が載ってたり、当時のパソコンでの漢字処理事情が垣間見られて懐かしい感じ。松丸氏による当時の古漢字処理事情は興味深い)
(夜中3時間毎に睡眠時間が分断される生活はやはりなかなか大変で集中力が持続しづらいのだが、CH111 の予稿 https://t.co/BLh8oGqEkK が自分の役に立つ。w ただ、若干の差異はあって update 版を書き残しておくべきか (一応、メモは取っているが))
RT @stealthinu: JUNETやWIDEの初期の頃の話が読める。k14フォントってそうやって生まれたんだとか。 / “25 Years of WIDE Project : Up to this point and beyond this point…” https:…
(『素性名の IRI 用表現』の基本的な仕組は https://t.co/j6erWTZ5sf の通りなのだが、漢字粒度モデルがその後ちょっと変わってしまって、具体的な prefix は https://t.co/zN9uHnQf7X の実体参照の説明にあるものに変わってる)
(『素性名の IRI 用表現』の基本的な仕組は https://t.co/j6erWTZ5sf の通りなのだが、漢字粒度モデルがその後ちょっと変わってしまって、具体的な prefix は https://t.co/zN9uHnQf7X の実体参照の説明にあるものに変わってる)
(CHISE-wiki / EsT での RDF/XML の仕様については https://t.co/oqPusabWTY に書いたのだが、課題にあるように URL の形式は今の EsT のような静的風な形式にすべきで、いろいろやり直したいが、XML はぶっちゃけしんどい)
RT @sarasvati635: 非専門家指向のデジタル・アーカイヴズに向けて ―漢文表現へのXMLの適用― https://t.co/aCpWwd0zeU @acaxinoya

20 0 0 0 OA データ科学雑感

RT @ryotaiino: 生物物理誌、小松崎さんの巻頭言。面白い視点。「もしボルツマンの時代に,詳細な分子動力学シミュレーションにより,つぶさに分子一つ一つの動きを見ることができたならば,エルゴード仮説に立脚する理論体系にたどり着いたであろうか」データ科学雑感https:/…
@knagasaki 例えば、甲骨拓本の場合、複数の図録に採録されたり、後で、異なる片が繋がることが判ったりする(cf. https://t.co/r5Q526v9v8 )(綴合という分野?があるそうです)ので、複数のキャンバスで使い回せると良さそうです。

お気に入り一覧(最新100件)

いきいきとした導入!誰しも頁を進めてしまうレベル. > 特異モデルとベイズ学習 - J-Stage https://t.co/NqnIJjJeLg https://t.co/8u00QpBQrp
『怪談摸摸夢字彙』の「〓」字は塗りつぶしていると言えるのでは? https://t.co/uYHu0DArhv https://t.co/DqDpLXoo5m https://t.co/SzwHPjZQA5
ヘボン式しかなかった日本のローマ字に、日本式(訓令式の元祖)を、導入したのは、田中館愛橘である(明治18年・理学協会雑誌)。彼の論を取りまとめた小パンフレットが、日本のローマ字社から出ている。この方面の基本文献と言える。詳細な音声学的考察がなされている。https://t.co/8q0afuJc05
めちゃめちゃ面白いの見つけちゃった 「子コノ子ヲ見テ井ル」 現代の私たちが片仮名の「ニ」と漢字の「二」の活字を使い分けるように、片仮名「子」が現役だった時代は矢張り活字を漢字と仮名で使い分けているものなのかな。 『尋常小学読書教本応用教授材料. 巻ノ二』㍾29 https://t.co/gtyl7Dv5hx https://t.co/C5nb0DApdp https://t.co/5LjmJaN9IX
【言語研究・掲載論文】古い言語学と新しい言語学 (服部 四郎) 68号 https://t.co/anYxQrr2xH
以前の検索では見落としていた、より古い例があった。 酒生慧眼・小林杖吉 編『地名人名書名新辞典』(1907年) https://t.co/q9YvVx7fqF https://t.co/knoYydcYGN https://t.co/f9dWhzQ4jJ
日文研の学術誌『日本研究』に掲載の大塚英志氏のこの文章、単なる学会展望というより、氏の膨大な著作に根ざしたポピュラーカルチャー「研究」批判として骨太の論考になっている。刊行当時も読んで唸ったが、改めて読むと今回論争になった書評の内容にも直接繋がっている。 https://t.co/NxgSkDPvkm
昨年末に「応用数理」に投稿した解説論文 「形式言語理論:非可換と可換のあいだ」 が J-STAGE 上で読めるようになりました. 形式言語理論特有の難しさや面白さを説明させてもらいました. 「応用」を意識して自然言語っぽい話もいくつか話題に取り入れてみました. https://t.co/B4PKRNZb6p https://t.co/qc71Z2O43m
PDFあり。 ⇒新海 拓郎 「変化する金魚養殖の技法 ―奈良県大和郡山市の事例を中心に―」 『総研大文化科学研究』第18号 (2022/3) https://t.co/3w3USmrHHH
TLで楷書の話を見たが、近世における楷書については私も書きました。ただ、今、読み返すと非常に分かりにくいなと反省しています・・・・・・https://t.co/kccmECu7Wz
ちなみに、七五三の普及については、こちら(の特に注)も参照するとよいかも。刊行年とかも見ると興味深い。/ 小池淳一「民俗儀礼の文芸資源化 : 七五三と岡見」国立歴史民俗博物館研究報告 205(2017-03) p.459-472. https://t.co/LAkBr1leHg
七五三の全国展開について、何か良い論文ないかなあ、と思って探してたら、べらぼうに面白い論文が。民俗学の論文だけど歴史学的でもあり。/ 岩本通弥 「可視化される習俗 : 民力涵養運動期における「国民儀礼」の創出」国立歴史民俗博物館研究報告 141(2008-03) p. 265 - 321 https://t.co/bzauXq7fSS
自分が受け取った不採用通知を分析して論文を書いた強者やで⋯。「本報告を嚆矢として,今後,不採用通知のさまざまな事例を報告することで,不採用通知を受け取った者の負の感情の軽減につなげるようにすることが,今後の展望として挙げられる。」https://t.co/GjYbzinJXJ

38 0 0 0 OA 機械翻訳

1962年に書かれた「機械翻訳」についての記事を発見‼️ #n年前の情報処理 当時の課題と、模索されていたアプローチ、必要な基礎知識が詳しく解説されている……
これとかお金は出すから再撮影してほしいんですよね: https://t.co/kWamWvGN57
和様活字使用印刷物の“オープン”な画像の例を探していたところ、わがためにあるかのごとき例が出てきた: https://t.co/rAaeUdGZLG
この論文タイトルのセンスが良すぎる… 島田泰子「副詞「なんなら」の新用法 : なんなら論文一本書けるくらい違う」 https://t.co/FnkvzEv87E https://t.co/Vlpi1rPCsa
日本語のラ行がRかLかの話,EPGを使った調音研究では変異が多いという結論。/ara/では歯音化側面破裂音[l̪],/iri/では口蓋化歯茎はじき音[ɾʲ],/oro/では後部歯茎音で書くなら[ɻ]に近い>Some aspects of Japanese consonant articulation:A preliminary EPG study. https://t.co/y2Zi7BvwKM
インパクトファクターやh-index(とその派生)の概要や問題点はこのあたりにまとまっています - 清水毅志. 研究活動に対する客観的かつ定量的な評価指標. 情報管理, 52(8) 2009, https://t.co/iFMyjjkuhj

27 0 0 0 OA SNS の進展

「SNSの進展」(https://t.co/gbkAT9f9qT)なる記事を書きました。5年前の「SNSの歴史」(https://t.co/dJCta8suuD)の続編です。あまりにも広大なテーマなので自分なりの切り取り方にすぎませんが、よろしければご笑覧ください。

31 0 0 0 OA SNSの歴史

「SNSの進展」(https://t.co/gbkAT9f9qT)なる記事を書きました。5年前の「SNSの歴史」(https://t.co/dJCta8suuD)の続編です。あまりにも広大なテーマなので自分なりの切り取り方にすぎませんが、よろしければご笑覧ください。
このように発表から60年以上経過してから脚光を浴びる論考もある。だからコストを掛けて保存し、管理していく。学術的営為とはその積み重ねだ。 / “大伴旅人について : 特に讃酒歌と梅花歌との関係について” https://t.co/Hqe4DGJTf2

151 0 0 0 OA 後漢書 120卷

後漢書 120卷. 21 - 国立国会図書館デジタルコレクション【高木浩明氏が発見した痕跡本「この本の上を土足で歩いたと思しき幼児の足跡が二箇所付いていた。足のサイズは12センチ」】 https://t.co/aheXwtZ3Au

151 0 0 0 OA 後漢書 120卷

後漢書 120卷. 21 - 国立国会図書館デジタルコレクション【高木浩明氏が発見した痕跡本「この本の上を土足で歩いたと思しき幼児の足跡が二箇所付いていた。足のサイズは12センチ」】 https://t.co/aheXwtZ3Au
「猫にはわかる量子プログラミング」、すごそうだった(編集したくないという意味で) https://t.co/FvKYSGcIwo
先行研究を探すのは結構大変で時間がかかります。でも「どうせないよ」「難しくて読めない」を乗り越えて、とにかく関連するキーワードで探し、いくつか読んでみましょう。そうしないといつまでたっても始まりません。「資料のえじき」では懇切丁寧に先行研究の探し方を解説!https://t.co/pquTgA4ni4
U-PARLが漢籍・碑帖拓本資料のFlickr公開 https://t.co/HJK1iFjiBe 実現のために取り組んだメタデータ研究に基づいて、特任研究員の成田健太郎さんが執筆された論文「碑帖拓本資料のデジタル公開における書誌記述の実践」がJ-STAGEで公開されました。 https://t.co/dWLKb1LJgq
@Qwerty_Fe 固定端の定義次第。反射波が逆相を固定端、同相を自由端と定義すると良さそうだが、教科書は気柱振動の閉じた端を固定端としているので、弦の振動と混乱がきている。この場合、固定端という用語の定義は縦波・横波で返る必要がある。教科書の記述はほぼ間違っている。参考;https://t.co/8lpBQ6TurF
#ほとがく 第2回で使った参考文献③:石井公成「「憲法十七条」が想定している争乱」(印度學佛教學研究 41(1), 133-139, 1992) https://t.co/X14Hemtvse #CiNii
「特に仮名や漢字をモチーフに,文字を構成要素とする「文字型」図案をその対象とし,各時代の特徴的な造形方法を抽出」PDFあり。 ⇒柳橋達郎「明治・大正・昭和期における日本の自治体紋章の造形とその変遷」『デザイン学研究』63(2016) https://t.co/r3JV63Jxv2
『国語科教育』が、J-STAGEで公開された模様。『謎の漢字』の103頁でも紹介されていた、村内英一「漢字の字体に関する問題ー書取の正誤判定の限界」も見られるようになりました。手偏のハネについての言及があります。https://t.co/OgZVn3PHpJ
野原 将揮 という方の博論『戦国出土資料と上古中国語声母研究 』 https://t.co/RYDdnJu0F5 上古音の声母(頭子音)に関する概論になりそう
日本語キーボードに関する学会での議論もまだ盛んだった時期の良いチュートリアル論文がありました。 「キーボードによる日本語入力」, 大岩 元, 1988. https://t.co/WfNtQPbh7c
JUNETやWIDEの初期の頃の話が読める。k14フォントってそうやって生まれたんだとか。 / “25 Years of WIDE Project : Up to this point and beyond this point…” https://t.co/d9yga6Un4M

20 0 0 0 OA データ科学雑感

生物物理誌、小松崎さんの巻頭言。面白い視点。「もしボルツマンの時代に,詳細な分子動力学シミュレーションにより,つぶさに分子一つ一つの動きを見ることができたならば,エルゴード仮説に立脚する理論体系にたどり着いたであろうか」データ科学雑感https://t.co/aD8Cogbncp
"CiNii 論文 -  コミック同人誌印刷所の成立 : 創作漫画文化の側から" https://t.co/MVKHuO0K8m ※本文リンクあり
1999年に自分が書いた論文の中で1596 年中央構造線地震のことに触れていた。この頃はまだ愛媛県内のトレンチ調査がなかったと思う。次の論文の356ページ表1「1596年 地震一近畿地方を襲った巨大内陸地震の可能性」https://t.co/jaxQeYxudl
きわめて興味深い、まさに新しい共同規制の構造です[PDF]。SNSと国家の関係、あるいはフィルタリング方式に対する一つのオルタナティブ・モデルとしても。「オーストラリアのネットいじめ対策−児童ネット安全コミッショナーの設置」 https://t.co/3m6X7L4uGo
すごく丁寧、包括的です。/ 資料デジタル化・公開に伴う権利処理<平成27年度 京都大学図書館機構講演会「デジタル化資料の公開にかかわる権利処理を学ぶ」> https://t.co/rGVXReacRb
海女の表象に関する先行研究はこちら。要するに、現在残っている「上半身裸で仕事に打ち込む海女」写真は、多分に「伝統の創造」である可能性が高い。 / “International Research Center for Japanes…” http://t.co/skB4WXVXnr

9 0 0 0 OA 仏教論理学

@iwa_jose ただ、桂先生のはあくまでインド(チベット)のもので、東アジアの因明については適当な入門書がありません。私は、院生の頃、大正時代に出た村上専精・境野黄洋『仏教論理学』で勉強しました(今はオンラインで読めます http://t.co/GeqCuuVBD0 )。
古田彩さんによる、量子コンピュータの研究史。計算ないし情報と物理の関係。ホイーラーとドイチュ。 / “CiNii 論文 -  二人の悪魔と多数の宇宙 : 量子コンピュータの起源” http://t.co/MBlwyiiXXm
「当時、よく使用されていた形が写本に保持されている状態」 / “JAIRO | 日本古代の文字資料と写本の字形をめぐって -真福寺本『古事記』の例を試みに-” http://t.co/5YgQXv3whn
CiNii 論文 -  キャラクターイラストレーション領域の概念整理と方法論確立のための基礎研究 http://t.co/6Yb6ZhmIOe #CiNii
『情報の科学と技術』5月号に掲載いただいた論文「Web APIの過去・現在・未来」をつくばリポジトリにて公開しました: http://t.co/7SsFJCL2OT
@2SC1815J うーん。わたしの知ってる外字セットじゃないですね。JIS X 0208の外字セット(たとえばこんなの http://t.co/mocS1oqbsQ とか?)をUnicodeのPUAに割り当ててるってかんじでしょうか。

106 0 0 0 OA ROMAHOPEDIA

ローマ法の研究者として知られる京大の柴田光蔵名誉教授が「ROMAHOPEDIA(ローマ法便覧)」という大部の書籍を書き、それが京大のレポジトリにてPDFの形で無償公開されています。 http://t.co/nmryl6MkdX
出版権がなかった時代の出版社の利益保護について。「著作者と出版者の協力と競合」『情報管理』Vol. 56 (2013) No. 4 P 255-257 https://t.co/PLzRzIXVnH
住基ネット統一文字とその問題点 か、安岡先生 https://t.co/VE40krhX

フォロー(215ユーザ)の投稿一覧(直近7日間)

フォロワー(382ユーザ)の投稿一覧(直近7日間)