XBRLを真面目に蒐集すると(ほぼ)自動で作れる(かもしれない)10大一覧リスト

EDINETの有価証券報告書/四半期報告書やTDnetの決算短信にEDINETコードと証券コードの情報があります。ですので頑張って3か月分集めれば全上場企業の一覧が作成できます。(EDINETにある「EDINETコードリスト」をダウンロードするほうが簡単です)

  • IFRS任意適用の企業の一覧

EDINETの有価証券報告書/四半期報告書に会計基準(AccountingStandardsDEI)という要素があり、それを見るとIFRSを任意適用している企業がわかります。

  • SEC基準採用の企業の一覧

IFRSと同じです。最近は新規にSECを採用する話はきかないですね。

  • 四半期配当を実施している企業の一覧

決算短信を見て、1Q/3Qに配当があるか見ればわかります。「例えばどんな会社があるの?」と聞かれたときは、「ホンダ」と答えるようにしています。

  • 内部統制の開示すべき重要な不備がある企業の一覧

内部統制報告書も次世代EDINET(いま現在動いているEDINET)から、XBRLの対象になりました。文章なので単純にフラグ的な分類はできないのですが、言い回しは決まっているので、ほぼ自動的に識別できます。より高い精度を望むのであればナイーブベイズ分類器を使えば完璧に識別できると思います。

  • 継続企業の前提に重要な疑義がある企業の一覧

内部統制と同様、文章(「重要事象等」要素)にタグ付けがしてあり、言い回しが決まっていますので、簡単に識別できます。

有価証券報告書の【コーポレート・ガバナンスの状況等】に記載され、文章にはタグ付けされますが、言い回しや表記が企業によってまちまちなので、名前や金額を自動的に識別するの難しそうです。

  • 委員会設置企業の一覧

いまいちマイナー(個人の感想です)なXBRL文書である「コーポレート・ガバナンス報告書」に記載されています。東証の上場会社情報ページなどからダウンロードできます。分析よりも、東証のサイトからデータを集める作業が大変です。

同上。

  • 上場企業のURL一覧

決算短信に記載されています。



新しくなったXBRLに対して「テキストブロック(文章)でタグ付けされているだけだから、詳細情報が取り出せない」という話をよく聞きます。そうとは限らないですよ。次世代EDINETからインラインXBRLが採用され、提出書類のHTMLが強制的にきれいに整理されましたし、有報などの法定開示書類は様式や言い回しが細かく規定されていますので、うまくやれば自動的に解析できるところは結構多いです。