著者
河本 哲 秋光 淳生 浅井 紀久夫
出版者
一般社団法人 人工知能学会
雑誌
人工知能学会論文誌 (ISSN:13460714)
巻号頁・発行日
vol.38, no.3, pp.D-M51_1-14, 2023-05-01 (Released:2023-05-01)
参考文献数
31

In Internet advertising, text information is added to increase the appeal of the ad to the viewers. However, some of the advertising documents contain inappropriate expressions. Wording or expressions that exaggerate the efficacy of a product or that recommend a product by a medical professional may violate the Pharmaceutical Affairs Law and the Act against Unjustifiable Premiums and Misleading Representations. Therefore, a system that can effectively and quickly detect problematic advertisements is required. Some advertisements cannot be properly classified based on word statistics alone. Therefore, information other than word statistics must be embedded in the document vector. The advertising documents targeted in this study have characteristics such as “biases in the word positions of specific words” and “periodic occurrence of specific words.” Frequently appearing words in problematic documents (especially in cosmetics advertisements) have strong biases in their word positions, resulting in a complex multimodal distribution of position of occurrence. Therefore, embedding word order information and word period information in document vectors is considered very effective for identifying problematic advertising documents.In recent years, the effectiveness of the BERT model has been recognized in various natural language processing tasks. However, it is also true that faster models are required for application on the Internet advertising. Therefore, as a means of achieving both inference speed and discrimination performance, we propose a document feature based on the discrete Fourier transform(DFT) of word vectors weighted by an index previously proposed in a study that attempted to categorize Chinese Internet advertisements. In addition, we employed the Complex-valued Support Vector Machines as discriminative models that can handle complex numbers and have high generalization performance even with small amounts of data.Although the discrimination performance of the proposed model is inferior to that of ALBERT and BERT to some extent, it is higher than that of DistilBERT, XGBoost, and LightGBM. The inference speed of the proposed model is somewhat slower than XGBoost and LightGBM and needs improvement, but is faster than DistilBERT. Those results indicate that the proposed model is promising when applied on the Internet. In addition, we found that when the index proposed in the previous study (which attempted to categorize Chinese advertisements) was applied to Japanese advertisements, that index emphasized the word vectors of specific nouns and verbs.
著者
三輪 眞木子 仁科 エミ 黒須 正明 高橋 秀明 柳沼 良知 廣瀬 洋子 秋光 淳生 Makiko Miwa Emi Nishina Masaaki Kurosu Hideaki Takahashi Yoshitomo Yaginuma Yoko Hirose Toshio Akimitsu
出版者
放送大学
雑誌
放送大学研究年報 = Journal of The Open University of Japan (ISSN:09114505)
巻号頁・発行日
no.32, pp.101-111, 2014

本研究は、面接授業「初歩からのパソコン」の受講で習得した放送大学生のデジタル・リテラシー・スキル(以下「DLスキル」)の定着状況把握を目的に実施した。この授業を2010年度2学期から2013年度1学期の間に受講した在学生に2013年11月に郵送アンケートを実施した。調査結果は、DLスキルの種類により、定着したもの、低下したもの、向上したものがあること、DLスキルの定着には、受講生の年齢、受講生のパソコン・インターネットの利用頻度が影響を及ぼしていること、DLスキルの向上とパソコン・インターネット利用頻度の間に相関があること、DLスキルの定着には、受講生のその後の学習方法が影響を及ぼしていることを示した。受講直後から本調査の期間に低下したDLスキルについて、授業後のスキル活用の機会を増加させる必要性が示唆された。また、定着効果のあるテレビ授業「遠隔学習のためのパソコン活用」の受講と同好会等への参加を促す必要性が示唆された。
著者
河本 哲 秋光 淳生
出版者
人工知能学会
雑誌
人工知能学会全国大会論文集 (ISSN:13479881)
巻号頁・発行日
vol.31, 2017

インターネット広告におけるユーザーの行動特徴(訪問したサイトやクリックした広告など)は一般的に高次元のスパースなデータである。 広告効果の高いユーザーを抽出するための特徴獲得と計算の高速化の両立は重要な課題である。 本稿では、オートエンコーダによるWeb広告のスパース特徴を活かした効率的な学習モデルを提案し、得られた特徴の有効性を検証する。