「ゎナ=∪も行くょ〜」も修正 —— KDDI研、「くだけた表現」の自動判読技術を開発
エンタープライズ
その他
注目記事
-
【デスクツアー】真似したい自宅デスク環境一挙公開!
-
子どものネットトラブル、「性犯罪」危惧する父兄が40%超 〜 ネットスター調べ
-
セールスフォース・ドットコム、企業ソーシャルプラットフォーム「Salesforce Chatter」を新たに発表

Web上の文章には誹謗・中傷や犯罪予告などの違法・有害な書き込みも含まれており、これらの表現を言語解析によって自動的に検出するフィルタリング技術に注目が集まっている。しかしWeb上の文書には口語やギャル文字、伏せ字などが多数含まれている上に、日々新しい言葉も現れており、従来の言語解析技術では正しく解析することが困難だった。
今回開発された技術では、「ゎナ=∪も行くょ〜」「auの携帯ってヵゎいいね」「オ●マ大統領来日」といった文章であっても、システムが自動修正し、「わたしも行くよ」「auの携帯ってかわいいね」「オバマ大統領来日」と解析可能な文章に変換する。解析不能なくだけた表現を検出し、その修正候補となる表現を新聞文書などの正規な表現を多く含む文書から自動的に検索して取得。取得した複数の修正候補の中から適切な表現を選ぶために、同じような文脈で頻繁に使われている表現かどうか、元のくだけた表現から大きく変化し過ぎていないかどうか、修正後の文章が日本語として自然かどうか、といった指標を計算する。なおこの技術を商用のブログ記事に適用した結果、従来の形態素解析器では解析できなかったくだけた表現を最大38% 減少させることを確認したとのこと。
この技術は、情報通信研究機構(NICT)からの委託研究である「インターネット上の違法・有害情報検出技術の研究開発」の一部として開発されたもの。本技術の利用により、Web上の文書を高精度に解析し、違法・有害な情報のフィルタリング精度を向上させたり、掲示板の口コミ情報から商品の評判を高精度に分析したりすることができるようになる見込みだ。今後は本技術を違法・有害情報フィルタリング技術などに応用していく予定。
《冨岡晶》
特集
この記事の写真
/
関連リンク
関連ニュース
-
子どものネットトラブル、「性犯罪」危惧する父兄が40%超 〜 ネットスター調べ
エンタープライズ -
セールスフォース・ドットコム、企業ソーシャルプラットフォーム「Salesforce Chatter」を新たに発表
エンタープライズ -
小学生の「情報モラル教育」家庭?学校? 父兄の意識差あきらかに 〜 gooリサーチ調べ
ブロードバンド -
NEC、アプライアンスサーバがトレンドマイクロのSaaS型セキュリティサービスに対応
エンタープライズ -
日本情報通信、チェック・ポイント「VPN-1 Power VSX」搭載装置を日本で初販売
エンタープライズ -
「サイト管理人がウイルス感染を助長しないTIPS」、G Dataが公開
エンタープライズ -
NTTぷらら、「ネットバリアベーシック」で有害サイトフィルタのレベルを細分化
エンタープライズ -
警察庁「インターネット・ホットラインセンター」、上半期は通報62,462件 〜 違法情報が大幅増
エンタープライズ -
G DATA、ウイルス対策ソフト最新版「インターネットセキュリティ2010」販売開始
エンタープライズ -
TCAと日本レコード協会、「違法音楽配信対策協議会」を設立
エンタープライズ -
NTT Com、企業向けクラウド型メールサービス「Bizメール」を発表
エンタープライズ -
G DATA、ウイルス対策ソフト最新版「インターネットセキュリティ2010」9/17発売
エンタープライズ -
IIJセキュアWebゲートウェイサービスが「マルウェア防御オプション」を試験提供 〜 ブラックリストを活用
エンタープライズ -
【子どもとネットVol.1】ティーンのオンラインセーフティ〜意識と取組み
エンタープライズ