Comments (20)
参議院>今思い付きで http://www.sangiin.go.jp/japanese/joho1/kousei/giin/194/giin.htm のページをコピーして google spread sheet に貼りつけたら一覧が一撃でできてしまった!!
https://docs.google.com/spreadsheets/d/1sL6IaDdNyBQM1AI2br6P2ZVd0qex9uFMIsnq28AKIBo/edit?usp=sharing
from codeforelection.
ちょっとスレ違いですが、基本的にFacebookUrlについては、FacebookPageを使うのがFacebookの運用ポリシーにもそっているような気がしますので、原則FacebookPageを使い、個人ページは出さないのがいいと思います。どうでしょう?
FacebookページをベースにするポリシーのPros/Cons
Pros
- FBのポリシーに沿っている
- 本来個人ページはプライベートなものという位置づけ
- FB的に正しい使い方を推奨できる。
- 機械的に集められる
- 人手でも検索エンジンを使える(個人ページは検索できないことも多々ある)
Cons
- 登録データ数が減る
- FBのポリシーに準じない利用をしている人(個人ページで政治活動している人)がわりと存在している
- 正しくない使い方を是認することになる。
from codeforelection.
は存在しない過去の都道府県?が入っていたので除外して、知事の名前も表示するようにしたSPARQLが以下です
http://tinyurl.com/yayb8bv7
from codeforelection.
http://tinyurl.com/ycd6c69l 順番がバラバラだとわかりづらいので、都道府県コード順に並べてみました
from codeforelection.
都道府県知事や参議院の件です。都道府県議会議員はどうするのかなど。
from codeforelection.
以下のようなデータは一般向けにも公開できると良いと思います。
- 立候補者一覧
- 政党一覧
- 選挙区一覧
- 当選者一覧
from codeforelection.
都道府県議会議員は、今回の作業のスコープ外でよいと思います。(mySocietyにも、やらない、ということで同意とれています)
参議院は上記でリストができた(!)ので、GrayDBにシートつくります。
都道府県知事は @higa4 さんが前にリストつくってた、と言っていたような? もし勘違いだったらすみません。
from codeforelection.
備忘:mySocietyからきているシートのなかで、Facebook URLというものがあって、mySocietyに確認しています。
Facebook URLが「個人のID」なのか「Facebook Page」のどちらなのか。両方ある場合にどちらをカラムに入れるべきか。
from codeforelection.
@nyampire 都道府県知事はwikidataに入っています。下記は都道府県から知事の一覧を抜いたものですがQ番号しか出ていないので、知事の属性が必要ならヒトから知事の経験者を抜いたほうが良いのかもしれない。
>誰かSPARQL使えるるヒトお願い
http://tinyurl.com/y85snzhc
from codeforelection.
Facebook page は Facebook の収益事業として設定されたというのはあります。ただ個人ページを出さないというのが facebook の policy …かどうかはちょっと見つけられませんでした。Facebook ページは事務所が運営していることも多いので、データベースとしては両方整備しておいて、どう使うかは利用者に委ねるのが良いかと思いましたが、どうでしょうか。
from codeforelection.
個人アカウントページからFBページへの移行を推奨していたのは個人的にFBの営業さんから話を聞いたのが原点です。今はどうなっているのか?ですが、基本的に変わらないと思います(多分)。ちょっと面白いので調べてみます
from codeforelection.
Facebook URLの件、mySocietyから回答がありました。
個人IDとpages、どっちでもいいけど、どちらかというとpagesのほうがよい、とのこと。
We have a tool that can normalise the URLs for Facebook which can help - the Facebook URL can be for either personal profile or pages but we prefer pages if they are available.
from codeforelection.
参議院と都道府県知事については別途Issueをたてたのでそちらで。
衆議院選挙については、22日まではだいたい以下の作業と思っています。
抜け漏れあったら指摘いただきたくです。
- Facebookページと個人IDの内容確認(人海戦術)
- 立候補者がSNSアカウントを持っていない場合に、カラムへハイフン(-)を入れる(人海戦術)
- Facebook IDおよびページのカラムの表記を、IDからURLに変更する(http:// で始まる形式にする)
- GrayDBの情報をwikidataに登録 #61
- 人海戦術の作業に対して解説文書を作成する(HowToContribute.mdのアップデートをする)
22日以降、GrayDBで、当選者に対してフラグをたてる作業が必要です。
- 当選者の一覧(可能な限り公的ソース)を入手する
- 当選者の一覧データを作成(GrayDBの候補者リストに対してフラグたてる)
- mySocietyにデータを送る
from codeforelection.
FB,TWのアカウントの件ですが
候補を機械的に抽出する仕組みを作りました。
メディア報道で把握した立候補者について処理したものが下記になります。
下記のシートをExcelなどで開いて、正解列に1を入れるなどしていけば、ある程度機械的に入ると思います。
https://github.com/codeforjapan/codeforelection/blob/master/data/graydb/haaku_sns_results.sjis.csv
もっとも、明らかにとれてないものもあります。
APIを使っているbingの検索精度がネックになっています。
google を使えると良さそうなのですが、作成した段階ではgoogleの検索APIが使えると思ってませんでした。。
from codeforelection.
ありがとうございます。
では、作業としてはこんなかんじでしょうか。
- 佐藤さん作成のBing検索結果から、正解データに1を入れる
- 前項のデータとGrayDBをマージする
from codeforelection.
それでいいと思います
from codeforelection.
残念ながら、結構同姓同名の別人が入っているようです…。
from codeforelection.
同姓同名は、誕生日もチェックできると精度が上がるとは思います。機械的に可能かはわかりませんが
from codeforelection.
Excelレベルでデータメンテナンスに協力してくれる人がいるのでタスク化しておいてもらえると一日数時間でもちょいちょい人手で整備をすることができます。
この件で、過去の衆議院選の結果は立候補者の当選回数をはじめとして統計的にいろいろ参考になる情報なのですが、立候補者ごとに探すのは効率が悪すぎるので、各衆議院選挙の結果一覧から一括してwikidataを更新することを考えています。第40回くらいから第47回(前回)までの衆議院選結果をwikipediaをみながら表形式に整理して頂けると一括してwikidataに登録できるため大変ありがたいです。もしお手伝い頂ける方がおられましたら下記シートにて作業お願いします。
https://docs.google.com/spreadsheets/d/1bxFWmlFr81jaDnvVE31rQXSdsD3JuIuxUDTWBTHn9_Q/edit#gid=0
from codeforelection.
@higa4 さんからの最後の質問を別Issueにして対応する。
from codeforelection.
Related Issues (20)
- Wikidata data model HOT 12
- wikidataへのデータ登録再開に向けた方針検討 HOT 59
- Wikidata:Notability HOT 8
- popolo JSONを作成する HOT 2
- 参議院と都道府県知事のデータを集める HOT 29
- GrayDBの不要シートの削除 HOT 3
- 当選者に対する収集データについて(選挙後:22日以降) HOT 1
- 選挙区に対して、area_id (区コード) の割り振りは可能? HOT 6
- wikidata 名寄せ依頼 HOT 1
- Wikidata: 選挙立候補者について HOT 7
- Wikidata: 立候補者の分析・視覚化クエリー集 HOT 6
- 当落情報の記載について HOT 10
- Wikidata: フェイスブックID・公式フェイスブックページの登録方法 HOT 8
- 第48回衆議院総選挙「前」の議員データベース HOT 6
- Popolo と Wikidata の対応をドキュメント化
- [Wikidata][merge依頼] Masahara Nakagawa HOT 7
- 2017の状態を残せるドメインにする HOT 1
- Wikidata関連ツールのフィードバック HOT 1
- 衆議院開催期間のwikidata上の表現を決める
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from codeforelection.