imas / imasparql Goto Github PK
View Code? Open in Web Editor NEWimasparql's RDFs
Home Page: https://sparql.crssnky.xyz/imas/
License: MIT License
imasparql's RDFs
Home Page: https://sparql.crssnky.xyz/imas/
License: MIT License
RDFの日本語フィールドが xml:lang="ja"
だったり xml:lang="jp"
だったりして統一されていません。
国ではなく言語ですので、 ja
のほうが正しいと思うのでそちらへ統一すべきかと思います。
(使い分けに何か意図があったらごめんなさい)
あった方が良い?
横山奈緒のようなプロフィールには無いけど、明言している場合など
#123 で追加された第7回総選挙結果の rdf:type が、前略#CinderellaRanking "Person" になっている。
第6回までは、前略#CinderellaRanking "Result" であった。
/URIs/imas-schema.ttl にあるのも、CinderellaRanking "Result" (line68-70) である。
というわけでどちらかに統一できます?
アイドルのアルファベット表記欲しい
七草はづきさんや天井社長が登録されていないですけれど。
追加するのは簡単です。
765、ミリ、315をお手本に。
PREFIX schema: <http://schema.org/>
SELECT * WHERE {
?s schema:name "島村卯月"@ja.
}
はちゃんと結果が返るのですが、
PREFIX schema: <http://schema.org/>
SELECT * WHERE {
?s schema:name "ピンクチェックスクール"@ja.
}
では結果が返ってきません(@ja
があってもなくてもだめでした。本来であれば、?s
としてユニットを表すURIが返るはず)。なお
PREFIX schema: <http://schema.org/>
SELECT * WHERE {
?s schema:name ?n.
filter(regex(str(?n), "^ピンクチェックスクール$")).
}
とすれば結果が得られました。
実際RDFを見てみると、アイドル名の場合は<schema:name xml:lang="ja">島村卯月</schema:name>
のようになっているのに対し、ユニット名の場合は<schema:name rdf:datatype="https://www.w3.org/TR/xmlschema11-2/#string">ピンクチェックスクール</schema:name>
とdatatypeが別途指定されており、これが問題なのではという指摘を今日のim@sparqlハッカソンにおいていただきました。
これは意図的なのものでしょうか?
これによってクエリ
PREFIX schema: <http://schema.org/>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX imas: <https://sparql.crssnky.xyz/imasrdf/URIs/imas-schema.ttl#>
SELECT ?unit (?name as ?member)
WHERE {
?s rdf:type imas:Unit;
schema:name ?unit;
schema:member ?m.
?m schema:name ?name;
filter(regex(str(?unit), "KBKYZD"))
}
は以下のように同じ名前を2度返しますが、
{
"head": {
"vars": [ "unit" , "member" ]
} ,
"results": {
"bindings": [
{
"unit": { "type": "literal" , "value": "KBKYZD" } ,
"member": { "type": "literal" , "xml:lang": "ja" , "value": "白坂小梅" }
} ,
(中略、星輝子、輿水幸子、姫川友紀も同様)
{
"unit": { "type": "literal" , "value": "KBKYZD" } ,
"member": { "type": "literal" , "xml:lang": "ja" , "value": "小早川紗枝" }
} ,
{
"unit": { "type": "literal" , "datatype": "https://www.w3.org/TR/xmlschema11-2/#string" , "value": "KBKYZD" } ,
"member": { "type": "literal" , "xml:lang": "ja" , "value": "白坂小梅" }
} ,
(中略、星輝子、輿水幸子、姫川友紀も同様)
{
"unit": { "type": "literal" , "datatype": "https://www.w3.org/TR/xmlschema11-2/#string" , "value": "KBKYZD" } ,
"member": { "type": "literal" , "xml:lang": "ja" , "value": "小早川紗枝" }
}
]
}
}
以下のクエリ
PREFIX schema: <http://schema.org/>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX imas: <https://sparql.crssnky.xyz/imasrdf/URIs/imas-schema.ttl#>
SELECT (?name as ?member)
WHERE {
?s rdf:type imas:Unit;
schema:name "KBKYZD";
schema:member ?m.
?m schema:name ?name;
}
は以下のように1回ずつしか返さない
{
"head": {
"vars": [ "member" ]
} ,
"results": {
"bindings": [
{
"member": { "type": "literal" , "xml:lang": "ja" , "value": "白坂小梅" }
} ,
(中略、星輝子、輿水幸子、姫川友紀も同様)
{
"member": { "type": "literal" , "xml:lang": "ja" , "value": "小早川紗枝" }
}
]
}
}
というような不思議な結果にもなっています。
http://schema.org
ここに無ければ他を探す(foafなど)。
または、imas語彙として登録する。
他にもやり方がある?
現在は秋月涼のURIを男女兼用としているが、分けるべきか
同じにする問題点として、同じ人物だが、プロフィールが2つ出てしまう(876用・315用)。
分けてしまうと、同じ人物としてリンクすることが難しくなる。
とりあえずドリフのたびに出てくるユニットだからもう膨大な人数になってるはず
見た感じ第3回と第9,10,11回のDLFしかデータが入ってないっぽいから
今現在、imas:Titleでなんとなくシリーズ?事務所?って感じで曖昧に分けてるけど、ちゃんとしたい。
出演作品を書く
所属事務所を書く
URI指定 Ref. #215
プロフィールぜんぜん公開されてませんが
付けないと、簡易詳細(https://sparql.crssnky.xyz/imasrdf/RDFs/detail/・・・)が発動しない
語彙を作る?
またテキストに含まれる情報をどれだけ載せるか。
発言者、誰に向けて、状況、ソース、Pの選択肢(?)
以前、デレパでクイズになったきらりを始め、時期によってプロフィールの数値が変わるアイドル、特訓後に変わるアイドルがいるみたいです
imas:title
で行きます
たぶん、ぐるっと囲った円の色が個別カラー
参考:https://github.com/ktnyt/imascg
Class::CallName
imas:Source Caller <Character_URI>
imas:Destination Callee <Character_URI>
imas:Called Called "Text"^^xsd::string
お疲れ様です、プロデューサーさん。
他社のアイドルですが、ストレイライトの皆さんが仲間になりました。
ご確認よろしくお願いしますね。
現在、プロフィール上の趣味が「なし」となっているアイドルは、以下の3名です。
このうち、双葉杏はimas:Hobby
が「なし」となっていますが、ジュリアと都築圭の2名はimas:Hobby
が定義されていません。
「なし」と表記するか、未定義とするか、どちらかに統一すべきと考えます。
個人的には、プロフィールに「趣味」欄がないアイドルと区別するために、「なし」表記で統一するほうが良いと思います。
誕生日があるのに、星座情報が無いアイドルが居る
数値が入るところに文字列(「ボン」「キュッ」「ボン」的な)が入っているので、型を直す
語彙: bust, constellation, hip, waist について、
imas-schema.ttlで大文字始まりで定義されているが、RDFs配下では小文字で使用されている。
各XMLファイルを編集するにあたって、文字コードなどが統一されていないことが少し気になりました。
$ file RDFs/*
RDFs/283.rdf: exported SGML document text, UTF-8 Unicode (with BOM) text
RDFs/765AS.rdf: UTF-8 Unicode (with BOM) text
RDFs/765MillionStars.rdf: UTF-8 Unicode (with BOM) text
RDFs/876.rdf: UTF-8 Unicode (with BOM) text
RDFs/961.rdf: UTF-8 Unicode (with BOM) text
RDFs/CallTable.rdf: Little-endian UTF-16 Unicode text, with CRLF line terminators
RDFs/CinderellaGirls.rdf: exported SGML document text, UTF-8 Unicode (with BOM) text
RDFs/CinderellaIntroduction.rdf: UTF-8 Unicode (with BOM) text
RDFs/CinderellaRanking.rdf: ASCII text
RDFs/Clothes.rdf: exported SGML document text, UTF-8 Unicode (with BOM) text
RDFs/Clothes_Own.rdf: Little-endian UTF-16 Unicode text, with CRLF, CR line terminators
RDFs/Disc.rdf: UTF-8 Unicode text
RDFs/Event.rdf: UTF-8 Unicode text
RDFs/Live.rdf: UTF-8 Unicode text, with very long lines
RDFs/MusicComposition.rdf: UTF-8 Unicode (with BOM) text
RDFs/SideM.rdf: UTF-8 Unicode (with BOM) text
RDFs/Song.rdf: UTF-8 Unicode text
RDFs/Staff.rdf: UTF-8 Unicode (with BOM) text
RDFs/Unit.rdf: exported SGML document text, UTF-8 Unicode (with BOM) text
RDFs/Unit_memberOf.rdf: Little-endian UTF-16 Unicode text, with very long lines, with CRLF line terminators
$ file URIs/*
URIs/imas-schema.ttl: UTF-8 Unicode (with BOM) text
文字コード
改行コード
ファイル末尾の改行
個人的には、Linuxなどで標準的な「UTF-8・LF・ファイル末尾の改行あり」に統一するのが好ましいかと思うのですがいかがでしょうか。
今後も新しくXMLファイルが追加されていくことでしょうし、CIでチェックするようにするのもいいかもしれません。(やりすぎですかね笑)
黛 冬優子 (まゆずみ ふゆこ) | アイドルマスター シャイニーカラーズ(シャニマス)
- 常に控えめな笑顔で、清楚な女の子。可愛いものが大好きで、周囲への気配りもできるため人に好かれる性格。専門学校1年生。
+ 常に控えめな笑顔で、清楚に見える女の子。可愛いものが大好きで、周囲への気配りをするなど人に好かれるように振る舞う。専門学校1年生。
ゲーム内でプロデュースできるようになったことで紹介文が変わったようです。
清楚な女の子
-> 清楚に見える女の子
周囲への気配りもできるため人に好かれる性格
-> 周囲への気配りをするなど人に好かれるように振る舞う
im@sparqlとしてはどちらを正とするのがいいでしょうか。
公式サイトの最新の記述を採用するのが自然?
"name": { "type": "literal" , "datatype": "https://www.w3.org/TR/xmlschema11-2/#string" , "value": "TIP! TAP!" } ,
".1": { "type": "literal" , "value": "栗原ネネ 松原早耶 乙倉悠貴" }
} ,
{
"name": { "type": "literal" , "datatype": "https://www.w3.org/TR/xmlschema11-2/#string" , "value": "TIP!TAP!" } ,
".1": { "type": "literal" , "value": "乙倉悠貴 栗原ネネ 松原早耶" }
おうちでやる
日付系の型で、warningが発生している。
日付系はISO 8601で定められた形式が使える。
現在は分かりやすさでその「拡張形式」を利用しているが、基本形式にすべきか。
かわいい!
https://twitter.com/46S_ayu/status/1071156547621871616
役の名前とかから場所を推察するとTheaterでなくTheatreになるのかななんてことを思ったりしました
P向け名刺管理サービスの担当アイドル登録にim@sparqlのデータを使わせていただいているのですが、アイドル名を検索するときに、例えば「あ」で検索すると、名前に「あ」を含むアイドルのうちジュリアだけが引っ掛かりません。(天海春香、アスラン=BBⅡ世、エミリースチュアートなどその他のアイドルは(おそらく)全員検索できています。)
検索のために投げているクエリは以下の通りです。
PREFIX schema: <http://schema.org/>
PREFIX imas: <https://sparql.crssnky.xyz/imasrdf/URIs/imas-schema.ttl#>
SELECT distinct ?name
WHERE { ?s imas:nameKana|schema:name ?o;
?p imas:Idol.
FILTER(regex(str(?o), "あ")).
?s schema:name ?name.}
order by(?name)
データが間違っているのか私のクエリが悪いのか分からないのですが、よろしくお願いいたします。
PS4になってから複雑化して、モバイル版で専用になって、一つにまとめるのもおかしい(?)
#85 でも使いたいし、プロフィールが空でも作っておけば何かと使えそう
シンデレラやSideMってイメージカラーどうする?
シンデレラ→サイリウムの色
SideM→ユニットカラーをサイリウムから?
(実際765,Millionも公式でRGBで厳密かつ不変に決まってるわけじゃないけど)
Live.rdfにある「Performance」という語彙が定義されていない
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.