Wikipedia‐ノート:多数の言語版にあるが日本語版にない記事

これはこのページの過去の版です。Kentikun (会話 | 投稿記録) による 2023年10月19日 (木) 01:50個人設定で未設定ならUTC)時点の版であり、現在の版とは大きく異なる場合があります。


最新のコメント:1 年前 | トピック:音楽に関する項目の分割提案 | 投稿者:Kentikun

「Suggest articles from interwikis」について

標記について、現在このツールは動作しません。また、作者の履歴を見ると2011年に活動を終了しており今後の対応も絶望的でしょう。よって除去しました。--6144会話2021年3月13日 (土) 03:44 (UTC)返信

WIkidataを使った探し方について

先日、少しだけ項目を探して追加してみたところ、探すのがとても大変でした。更新されているみなさんはご存知かもしれませんが、今の所探す方法などが書かれていないようなので、私が探すのに使用したWikidataを使った方法を記載しておきます。なお、紹介する方法はウィキメディアのタイムアウトの方針から、全言語含むWikipedia全体の記事数が増えていくと徐々に使えなくなっていく不完全なものです。

  • sitelink72個のページで、jawpへのリンクを持たないもの

各列の意味は以下の通りです

item WikidataのアイテムID(Q)
label Wikidataのラベル、Wikipediaのタイトル
w Wikidataの属性、大まかに何のページか
iw_count 何言語版にリンクしているか

これは、Wikidataのクエリを使って、以下のように記事を探しています。

  • すべてのWikimedia wikiへのリンク(sitelink、と言います。後述)がある程度以上あるWikipediaのページをリストアップ
  • Wikipedia: Category: Temlate: Help: Module: Portal:などのページを除外
  • その中で日本語版Wikipediaにリンクしていないページをリストアップ
  • 残ったページの、言語間リンクの数をカウント

sitelinkとは、Wikipedia以外のWikimediaCommons、Wikisource、Wiktionaryなど、WikimediaのWikiすべてのいずれかへのリンクを指します。Wikidataではsitelinkを高速に検索する方法があるためこの方法を取っています。この方法で、サイトリンク数45以上のページでjawpにリンクがないページはすべて探すことができました。それ以下では絞り込みをする必要がありそれについてもすこしだけ後述します。

まずは現状だいたい普通に検索できるsitelink 50以上の検索リンクを貼っておきます。区切りはタイムアウトが出ない程度に適当に区切っており、何度か試すと私の環境でもタイムアウトが出たり出なかったりしています。人がやる代わりにサーバリソースを食っているので、優しく使ってください。

サーバが空いているタイミングでは以下のような指定でもタイムアウトせずに動くことがあります。 70-160

sitelinkが50以下のページは数も多く、だいたいはタイムアウトしてしまいます。検索時間を短くする絞り込みをすればある程度は検索できます。

投稿サイズがだいぶ大きくなってしまったためこの辺にとどめておきます。実用へ向けたヒントとして、クエリの

  VALUES ?linkcount{ 45 46}

の数字のところを書き換えると検索するsitelink数を変更して検索できます。

欲しい条件などありましたら質問していただけたらある程度はお答えします。すべてができるわけではありませんし、現状分けられているカテゴリに相当する検索は、(私のわかる範囲が狭いのと、サーバのリソースてき両方で)できるものとできないものがある点ご了承願います。たとえば「政治家」や「惑星探査機」など具体的対象であれば比較的簡単に探せますが、「政治」、「宇宙」、「宗教」などWikidata的に曖昧なくくりのものは条件設定が難しく、条件が複雑になるとほとんどはタイムアウトで実行不可能になります。上記、人物よりも各国で異なる分類となる地域区分で検索できているsitelink数が大きくことなるのもそういったい事情からです。 --Suisui会話2021年10月20日 (水) 14:42 (UTC)返信

日本関連項目の分割提案

分割提案だけ提出されて議論が立ち上がっていなかったので勝手に進めます。

目的は日本に関する項目の分離です。 具体的には

  • 無印ページの日本文化や日本固有の物(「和式便器」など)などに関する項目
  • /人物ページにある日本人の項目
  • /言語ページにある日本語関係の項目(「日本語の数詞」など)
  • /作品ページにある日本人による作品

などが対象になると思います。

ご意見お願いします。--PuzzleBachelor会話2022年7月23日 (土) 14:22 (UTC)返信

生物や人物など他のサブページと括りが違いすぎるように見てますが、何か意図があると見て差し支えありませんか?--遡雨祈胡会話2022年7月23日 (土) 23:08 (UTC)返信
「私には」意図はありません。分割提案にあった(その前に執筆依頼にあったのでいったん誘導した)のに議論場所がなかったのでとりあえず場所を用意しただけです。この提案をした人物に関して思い当たることがあるならその予想は当たっている可能性があります。
私個人としては「あってもいい」と思う反面「これが成立するのはまずい」とも思っています。--PuzzleBachelor会話2022年7月24日 (日) 06:18 (UTC)返信
ご回答ありがとうございます。無理にとはもちろん申しませんが、『私個人としては「あってもいい」と思う反面「これが成立するのはまずい」とも思っています。』について伺えますと幸いです。ちなみに私のスタンスとしましては、国ごとに無限に分けることができてしまうので細分化して見づらくなることから反対です。--遡雨祈胡会話2022年7月24日 (日) 07:08 (UTC)返信
前提として「『日本語版』≠『日本版』だが、『国民の大半が日本語話者であり日本語が(事実上)公用語となっている国』である日本は日本語版にとって重要な国」「日本語版の参加者の多くが日本人」と認識しています。
「あってもいい」:従来の分野別だと苦手分野は最初から見ない可能性があるが、「日本」という分野なら最低限の知識や関心を持っている人が多いと考えられる。
「成立するのはまずい」:日本人が大半の日本語版において、「複数の他言語版にあるのに日本語版に存在しない日本に関する記事」がサブページを作れるくらいあるのはどうなのかと思います。
私の考えとしてはこんな感じです。--PuzzleBachelor会話2022年7月24日 (日) 09:35 (UTC)返信
  •   反対 「日本関連項目」のサブページ作成および分割に反対します。無印ページ、「 人物」、「言語」、「作品」のページをざっと見てみました。「人物」に関しては、15-5言語版の各サブページ、および関連項目の「宗教」「経済」「天文」「スポーツ」、「 スポーツ/サッカー 」もチェックしました。その結果、「 スポーツ/サッカー 」を例外として、その他のどのページにも日本関連の記事はほとんどあるいはまったく見当りませんでした。「人物」の数言語版において数人のマンガ家およびマンガのキャラクターの名前がいくつか見られた程度です。現状を見ればサブページを作るほどの量ではありません。また、現在の日本語版の盛況を考えれば、今後も「日本に関連した記事であって、かつ多数の言語版にあるが日本語版にない記事」がそんなに増えるとは考えにくいことです。--Loasa会話2022年7月24日 (日) 10:28 (UTC)返信
    それを考慮すると、Wikipedia:ウィキポータル 日本/翻訳依頼で十分ってことになりますよね--Sugi moyo会話2022年7月28日 (木) 15:40 (UTC)返信
    確認ありがとうございます。サッカー選手以外の実在日本人項目はCLAMPメンバーしか把握していなかったのでほぼ予想通りでした。ニコンのカメラとか漫画・ゲームの登場人物で項目数を水増しすることは可能ですが、分割するほどの記事はないという意見に同意します。やるなら私のように利用者ページのサブページでしょう。--PuzzleBachelor会話2022年7月30日 (土) 08:53 (UTC)返信

医学に関する項目の分割提案

2023年9月現在、サイズが18万kbを超えているため、病気・薬学などのPortal:医学と医療に関連するページを分割できないかと考えています。このページやWikipedia:多数の言語版にあるが日本語版にない記事/人物以下に収録されている項目を抽出する形です。なお「多数の言語版にあるが日本語版にない記事」のみを抽出した試作ページを利用者:佐藤なにが/試案・多数の言語版にあるが日本語版にない記事/医療として作成したのでご意見があればお願いします。--佐藤なにが会話2023年9月24日 (日) 01:26 (UTC)返信

  •   賛成 分割後リストも基本的に佐藤なにがさんの試案で良いと思います。なお分割前リストにあって試案にない項目を下に挙げときます(18言語までチェック)。あとHoarse voiceは27言語版ではなく32言語版ですね。それとサブカテゴリの名称ですが、医療だけでなくPortalに合わせ医学・医療のほうが良い気がします。
  • 35言語版:Dysarthria(ディサースリア {言葉をうまく発声できない症状})
  • 33言語版:Mucormycosis(ページ名未定 {真菌感染による病気})、Vivisection(生体解剖 {解剖})
  • 26言語版:Juvenile idiopathic arthritis(若年性特発性関節炎 {病気})、Lymphadenopathy(リンパ節症/リンパ節膨張症 {医学})
  • 25言語版:Helminthiasis(蠕虫症 {病気})
  • 23言語版:Whipple's disease(ホイップル病 {病気})
  • 21言語版:Locked-in syndrome(閉じ込め症候群/閉じ込め状態 {医学})、Severe combined immunodeficiency(重症複合免疫不全症 {病気})
  • 20言語版:Doctor–patient relationship(医師-患者関係 {医療倫理})、Semen analysis(精液検査 {男性の生殖能力を評価する検査})
  • 19言語版:Continuous positive airway pressure(CPAP(睡眠時無呼吸症候群への転送){睡眠時無呼吸症候群の治療法})、Flibanserin(フリバンセリン {性欲高進剤})、Rib cage(胸郭(胸への転送){骨})
  • 18言語版:Medical research(医学研究 {医学})、pimple(ページ名未定 {皮疹の一種、ニキビ・吹き出物が近いがともに日本語版にも立項済み})--Iso10970会話2023年9月24日 (日) 06:50 (UTC)返信
リストアップありがとうございます。試作版はもちろん暫定のものであり、人物関係のページからも転記を行おうと考えております。タイトルについても@Iso10970:さんのアイデアをそのまま活用したいと思います。--佐藤なにが会話2023年9月25日 (月) 01:21 (UTC)返信
  コメント (賛成寄りですが今回はコメント)分割について特に異論はありませんが、以下の点だけ気になります。
  • Wikipedia:多数の言語版にあるが日本語版にない記事/生物にある人体の部位(や今はほぼないですが病原体とかも)との切り分けをどうするのか(基準を決めてどちらかに書くか、両方に書くのか)
  • ②生物からの誘導文を追加すべきか(人体に関連する場合は医学と医療に記載してください、など)
あまり厳密に分けても仕方ないのですが、個人的には人間と哺乳類で共通の身体の部位については他言語版の記事で人間の病気や手術などの観点多めで記載されているものは医学側に記載したほうが有識者の方が拾い上げやすいような気がしています。
参考としてWikidata側に日本語版とのリンクが確認されない解剖学的構造(Q112826905)に分類される項目はすべてが医学に関連するわけではないでしょうがそれなりに数があることを把握しています。転記作業は特に深く手を付けられていませんが16言語以上のものが200件程度あるようで、これは分割を支持する理由にもなり得るのかなと思っています。Wikidataでの抽出--Mariobanana会話2023年9月27日 (水) 03:17 (UTC)返信
コメントありがとうございます。
①について:この件については試作を作るときに気にはなったものではありました。この分割は、既存の「多数の言語版にあるが…」の肥大化の抑制を目的として行うものですが、その目的が翻訳記事の作成の促進を妨げてはいけないと思います。
今のところ自分の方針としてはPortal:医学と医療に属するか微妙なもの、他のポータルにも含まれそうなものは、新しく作る「医学・医療版」ページに記載するほか既存のページにも記載したままにしようと考えています。(要するにケースバイケースです)
②について:分割はWikipedia:多数の言語版にあるが日本語版にない記事とその「人物版」(その下位のページも含む)・「生物版」から行うため、それぞれから新しく作る「医学・医療版」に「無印版」からは下位へのページとして、「生物版」・「人物版」からは関連項目としてリンクさせようと思います。
--佐藤なにが会話2023年10月1日 (日) 06:32 (UTC)返信
  賛成 お疲れさまです。現状、Portal:医学と医療/執筆依頼に古くて執筆意義が乏しい項目が蓄積しており、こちらが立項されるよりは、他言語版にあって日本語版にない記事が立項される方が有意義だと思いますので、分割されて医学だけのリストとして抽出された方が医学系執筆者の目にとまりやすくはなると思いますので良い御提案だと思います。ただ、医学のポータルは過疎状態でして、あんまり人が居ません。ただ、このままにしておくとますますポータルが衰退しますから進めていただいて良いものと思います。--Anesth Earth会話2023年10月1日 (日) 01:53 (UTC)返信

音楽に関する項目の分割提案

2023年10月時点で、Wikipedia:多数の言語版にあるが日本語版にない記事が 184kb、Wikipedia:多数の言語版にあるが日本語版にない記事/人物が174kb、Wikipedia:多数の言語版にあるが日本語版にない記事/作品が132kbと肥大化しているため音楽関係の項目をWikipedia:多数の言語版にあるが日本語版にない記事/音楽に分割しようと考えています。作成する手法としてはPortal:音楽に属するであろう記事をそれぞれの「多数の言語版にあるが日本語版にない記事」とそのサブページからピックアップして作成する形です。メリットとしては肥大化の抑制のほか、音楽に関する項目を一つにまとめることができる点ことが考えられます。また、試作として16言語版までの項目を利用者:佐藤なにが/試案・多数の言語版にあるが日本語版にない記事/音楽を作成したのでぜひ参考にして意見をいただきたいです。

なお、現在あると考えられるため「音楽」のページが肥大化した場合再びそのページを分割しようと思います。--佐藤なにが会話2023年10月18日 (水) 21:41 (UTC)返信

  賛成 少し記事を覗いてみたところ、
親ページ
39言語版
Quartet  四重奏/カルテット(曖昧さ回避)(重奏への転送){音楽のジャンル}
35言語版
Boogie-woogie  ブギウギ (音楽) {音楽}
34言語版
Rolling Stone's 500 Greatest Albums of All Time  ローリング・ストーンが選ぶオールタイムベストアルバム500 {音楽のランキング}
33言語版
Christian metal  クリスチャン・メタル {キリスト教音楽のジャンル}
31言語版
Hornbostel–Sachs  ザックス=ホルンボステル分類楽器分類学への転送){音楽学}
29言語版
Rest (music)  休符音符への転送){音楽記号}
28言語版
Music of India  インドの音楽 {各国の音楽}
など22項目(検索機能で調べました)
人物ページ
36言語版
Cratylus  クラチュロス {古代ギリシャの音楽学者}
32言語版
Paul Gray (American musician)  ポール・グレイ {アメリカの音楽家、スリップノットのメンバー}
28言語版
Steve Angello  スティーヴ・アンジェロ {スウェーデンの音楽プロデューサー}
27言語版
Sebastian Ingrosso  セバスチャン・イングロッソ {スウェーデンの音楽プロデューサー}
26言語版
Inayat Khan  イナーヤト・ハーン {インドの音楽学者}
25言語版
Dr. Luke  Dr. ルーク {アメリカの音楽プロデューサー}
22言語版
Frank Klepacki  フランク・クレパッキ {アメリカのゲーム音楽作曲家}
Rahul Dev Burman  R・D・ブルマン {インドの映画音楽作曲家}
20言語版
Mitch Miller  ミッチ・ミラー {アメリカの音楽家}
Robert John "Mutt" Lange  ロバート・ジョン“マット”ランジ {イギリスの音楽プロデューサー}
16言語版
Kim Fowley  キム・フォーリー {アメリカの音楽プロデューサー}
の11項目(検索機能で調べました)
作品ページ
54言語版
Eurovision Song Contest 2020  ユーロビジョン・ソング・コンテスト2020ユーロビジョン・ソング・コンテストへの転送){COVID-19の影響でキャンセルされた音楽コンテスト}
16言語版
music of Ukraine  ウクライナの音楽 {ウクライナの音楽}
15言語版
The Beatles: Rock Band  ページ名未定 {アメリカの音楽ビデオゲーム}
6言語版
Music of Star Wars  スター・ウォーズの音楽 {映画音楽}
の4項目(検索機能で調べました)
がありました。分割するには十分な記事の量だと思います。私は親ページの15言語版以下は見ていません。思案の通りでいいと思います。--岩谷尚文会話2023年10月19日 (木) 01:48 (UTC)返信
プロジェクトページ「多数の言語版にあるが日本語版にない記事」に戻る。