ko-ichi-h / khcoder Goto Github PK
View Code? Open in Web Editor NEWKH Coder: for Quantitative Content Analysis or Text Mining
Home Page: http://khcoder.net/en
License: GNU General Public License v2.0
KH Coder: for Quantitative Content Analysis or Text Mining
Home Page: http://khcoder.net/en
License: GNU General Public License v2.0
KH Coder has Chinese interface but some messages have not been translated into Chinese yet.
There are lines like this:
max: '***not translated*** Max // 最大'
This is an example of a message that is not translated into Chinese. The meaning of this line is:
message-id: '***not translated*** English message // Japanese message'
Please edit the line like this to add Chinese message:
message-id: 'Chinese message'
Test the message file "config/msg.cn" you edited.
Commit, push and send a pull request.
KH Coder is available under the terms of the GNU GPL v2 or later. Contributed messages will be a part of KH Coder and the license of KH Coder will be applied. Your contribution will be documented in the "Contributors" page.
Hello,
is it possible to plot a third and fourth dimension using correspondence analysis? KH Coder does a great job providing two dimensional plots with correspondence analysis. In my specific case variations are explained to a relevant extent by more than two dimension. To give an example:
Dimension Cor ^2 Explained
[1,] 1 0.0122 29.71
[2,] 2 0.0104 25.33
[3,] 3 0.0080 19.52
[4,] 4 0.0053 12.91
[5,] 5 0.0028 6.91
[6,] 6 0.0023 5.62
[1] "iterations: 75"
The first two dimension already explain 55,04 percent of variations. To increase my outcome regarding an explanation of variations it would be helpful to have also the third and fourth dimension plotted. Is it feasible for the KH Coder to plot more dimension than two using correspondence analysis? Of course, space is restricted to three dimension but I wonder whether it is possible to visualize a third and fourth dimension. Or is it possible to implement a download option for a table (i.e., csv) with all numeric values of the profiles?
Best regards
Axel
以前に余所でご質問いただいたMVR(Modifier Verb Ratio)と、それに加えて名詞率の計算方法を、このIssueで検討します。
なおMVRおよび名詞率の定義はこちらのページに記載があります。
http://langstat.hatenablog.com/entry/20140913/1410534000
樋口先生
研究でKH Coderを使用しております。黒田と申します。
文書のクラスター分析について複数お伺いしたいことがありまして、投稿させていただきました。
よろしくお願いいたします。
①文書のクラスター分析は「非階層的クラスター分析」との解釈でよろしいでしょうか?
クラスター分析には階層的と非階層的に分けられるとのことですが、クラスター数を自由に決めることができる文書のクラスター分析は非階層的であると判断してよいのでしょうか。
また、その場合は、クラスター1とクラスター2など、隣り合ったクラスター間に何らかの関係はないと解釈するのでしょうか。それとも、階層的クラスター分析のように、隣り合ったクラスターは似たような関係にあるのでしょうか。
②クラスター数について
私は朝日新聞と読売新聞の社説を戦後から分析しているのですが(朝日は342、読売は282件です)、最小出現数による取捨選択やクラスター数は合わせた方が良いのでしょうか。
朝日新聞は145語でクラスターは9つ、読売新聞は105語でクラスターは8つが一番解釈しやすかったのですが…。
③Jacard距離について
文書のクラスター分析の場合、例えば朝日新聞の場合、145語以上出てくる語が含まれる文書が分析の対象となり、似た文書が同一クラスターに分類されるということだと思います。
この場合、特徴語におけるJacard係数は、145語以上出てくる語同士の共起ということになるのでしょうか?それとも語と文書の共起になるのでしょうか?
(「実例クラスター分析」が本学図書館にないため質問させていただきました)
お忙しいところ恐縮ですが、よろしくお願いいたします。
Windows 10
Version 3.Alpha.14
いつもお世話になっております。
ご質問失礼いたします。
新規プロジェクトを立ち上げると以下のエラーが生じます。
以前の書き込みで、KHcoder 3をドライブから削除して、Unzipから開くとありましたが、
Unzipが何を示すか調べてもわかりませんでした。
もう一度ダウンロードし直すということでしょうか?
PCに精通していなく、稚拙な質問で申し訳ございません。
■エラー・メッセージ
Error: Failed to create new DB! at /<Users/ /Desktop/khcoder3/
x_mac64>mysql_exec.pm line 189.
■その問題はチュートリアルの漱石「こころ」データでも同様に発生しましたか?
→はい
■お使いのOS
→:macOS 10.13.6
対応分析を行い各文書(各回答者)のスコアを出力する方法はあるかという旨のご質問を余所でいただきました。
本来は「データ表の種類」として「抽出語×文書」を選択して対応分析を実行し、その結果をCSV形式で保存すれば良いのですが、現時点(3.Alpha.15e)ではKH Coderのバグのため、この操作がエラーになります。
このエラーはRを使う以下の手順で回避できますが、修正版をすでに公開しましたのでKH Coderを更新していただくのが簡単かと思います。詳しくは別途のコメントに書きましたので、このページの下の方をご覧ください。
- 対応分析のオプション画面右上で「文書×抽出語」を選択して「OK」をクリック
- 結果をR形式で保存してRで実行:このスライドのp. 5までの手順
- Rで「 write.csv(c$rscore, file="c:/khcoder3/corresp.csv")」を実行
実行とは「R Console」画面に貼り付けて「Enter」キーを押すことです。これでCドライブの「khcoder3」フォルダに「corresp.csv」という名前で保存されます。各成分の寄与率を見るには「txt」を実行してください。
結果を見ると、入力データよりも文書数(回答者数)が減っている場合があります。これは分析対象の語を1つも含まない文書(回答者)が分析から省かれているためです。もし、他の変数との相関を見るために、他の変数を含むデータと結合するような場合には大きな問題になるでしょう。この対策については、別途のコメントに書きましたので、このページの下の方をご参照ください。
以上の操作によって、各文書(各回答者)のスコアを出力して使用することは一応可能です。
しかし単に面倒だというだけでなく、「抽出語×文書」表を使う対応分析は、データの形式上、寄与率の低い(数パーセント)成分が数多く抽出されます。そしてどの成分を分析に使うのかという(やや難しい)選択が必要になります。さらに、これはあくまで私自身の現在の考えですが、分析者が注目したい多様なコンセプト・トピック・事柄みたいなものを、統計的方法・自動処理だけで常に上手く取り出せるとは限らないと思います。
このため、開発者としてはこの方法を使うよりもコーディングをお勧めしています。対応分析や共起ネットワークのような多変量解析から、おもしろそうな成分/コンセプトが見つかったら、それらに関係する語群を手動で指定するのがコーディングです。テキストファイルの中で語を指定して、「コーディングルール・ファイル」を作成します。チュートリアルに付属の「theme.txt」を見て、同じような内容のファイルを「サクラエディタ」「秀丸」「メモ帳」のようなテキストエディタで作ります。
そうすれば、どんな人の回答にそれらの語が含まれるかを他の変数との「クロス集計」で分析できます。また「コーディング結果の出力」で、回答にそれらの語を含むかどうかを0と1のダミー変数で出力できます。「文書検索」画面で「tf順」を選べば、それらの語を多く含む実際の回答を閲覧できます。
手動のコーディングではなく、統計的方法を使うことにこだわりたい場合は、寄与率の低い成分が数多く抽出される対応分析よりも、NMFやトピックモデルと呼ばれるような方法が良いかもしれません。NMFやトピックモデルでは、「成分」にあたるものの数を、手で指定できます。ライブラリやコマンドを調べる必要がありますが、Rで実行できるかと思います。(上記の理由からあまりお勧めしないのですが…)
Hello,
Just a quick suggestion/question: will/could the next iteration of the KHCoder include a topic model function (both "bag of words" and ordered words)?
樋口先生
こんにちは。
KHCoderでの歌詞分析で、卒論を執筆中の学部生(立命館大)です。
この度、標記のことでお伺いさせて頂きたいことがあり、ご連絡させて頂きました。
先生が上梓なされた『社会調査のための計量テキスト分析』の中のp.53, 68において、論文中で文脈ベクトル算出の手順について述べられており, そのベクトル算出の為の頻出語の抽出条件において, p.53においては「800回以上5864回以下」, p68では「500回以上」という制限を定めていると思うのですが, この下限である800回以上や500回以上はどういう基準で定めているのでしょうか(上限については、サンプル数以上に出現する語は一般的と見なすのを基準とするのはよくわかりました)。布置語が100~200語あたりになるように、分析者が独自で設定しているようなものなのでしょうか。
お忙しいところ恐縮ですが、ご回答のお返事を頂けると幸甚です。
よろしくお願いいたします。
初めて連絡いたします。
稚拙な質問で申し訳ありません。
外部変数と見出しで1つの変数で複数の値を選択して、特徴語から共起ネットワークで表示したいのですが、どのように複数の値を設定すればよいのでしょうか?
"<>変数名-->値"を2つ以上指定したいのです。例えば、Aという変数が「いぬ」または「ねこ」の場合のようなことです。
お手数をおかけいたしますが、よろしくお願いいたします。
樋口さん
はじめまして。今卒業論文でkhcoderを使用し、タグをh1からh3までつけて、対応分析をしようとしているのですが、どうしても『Rを用いた推定または描画に失敗しました simple error in colnames...』『attempt to set colnames on an object with less than two dimensions』というふうに出てしまいます。
そのあとに、
『evaluating a method for function plot: Error in c$cscore : object of type builtin is not subsettable 』
が3回出たあとに
『can't call method "r_msg" without a package or object』というふうに出てしまいます。
Rを再インストールしたのですが上手く行きません。どうしたら良いでしょうか。
設定した条件は以下の通りです。
最小出現数 350 布置される語数 155
集計単位 H1
文 ケース数 109,929
段落 ケース数 75,218
H3 1
H2 1
H1 1
KH Coder has Korean interface but some messages have not been translated into Korean yet.
There are lines like this:
max: '***not translated*** Max // 最大'
This is an example of a message that is not translated into Korean. The meaning of this line is:
message-id: '***not translated*** English message // Japanese message'
Please edit the line like this to add Korean message:
message-id: 'Korean message'
Test the message file "config/msg.kr" you edited.
Commit, push and send a pull request.
KH Coder is available under the terms of the GNU GPL v2 or later. Contributed messages will be a part of KH Coder and the license of KH Coder will be applied. Your contribution will be documented in the "Contributors" page.
Hello,
When I try to use Correspondence Analysis, I get this error message. (For both Words>Correspondence Analysis and Coding>Correspondence Analysis)
eduroam-078-104-000-073:khcoder alessia$ perl kh_coder.pl Perl/Tk: 804.034 This is KH Coder 3.Alpha.14b on darwin. CWD: /Users/alessia/khcoder R Version: 3.5, x86_64 Using un-threaded functions... Connected to MySQL 8.0, khc21. ignore: 677,618,548,485,33,23,549,486,619,678,126,443,130,436,14001,24,86,90,87,91,88,92, ................... 5 wallclock secs ( 0.81 usr 0.02 sys + 0.01 cusr 0.00 csys = 0.84 CPU) Data matrix for R: 120 words x 2 docs Statistics::R::Bridge::pipe::read_processR, Sleep and Retry! Loading required package: sp Checking rgeos availability: TRUE Statistics::R::Bridge::pipe::read_processR, Retry: Loading required package: Rcpp Loading required package: RColorBrewer Non-function objects are not currently inserted (not traceable): .packageName Modified functions inserted through trace(): wordlayout output file: /Users/alessia/khcoder/config/R-bridge/khc21_word_corresp_1.png done: 00:00:42
It happens with my own files as well as the tutorial file.
KH Coder version
3.Alpha.14b via source code
OS
macOS Mojave 10.14.1
(I have another problem with R with Hierarchical Cluster Analysis. Should I ask about that in a separate thread?)
コーディングでの分析にはクロス分析がありますが、素データでのクロス分析は無いのでしょうか。例えば、「出現回数上位10の語」、もしくは、「指定した語」と指定した変数のクロス分析のイメージです。
KH Coder has Spanish interface but some messages have not been translated into Spanish yet.
There are lines like this:
max: '***not translated*** Max // 最大'
This is an example of a message that is not translated into Spanish. The meaning of this line is:
message-id: '***not translated*** English message // Japanese message'
Please edit the line like this to add Spanish message:
message-id: 'Spanish message'
Test the message file "config/msg.es" you edited.
Commit, push and send a pull request.
KH Coder is available under the terms of the GNU GPL v2 or later. Contributed messages will be a part of KH Coder and the license of KH Coder will be applied. Your contribution will be documented in the "Contributors" page.
Hi Dr. Koichi,
Just want to ask if the Malay language is supported or not to produce co-occurrence networks. Thanks
最新バージョンがSurface Proで動作しない現象が確認されています。
Surface ProはWindows 10 (Sモードではない)ですし、64bitです。
「アプリケーションは、このWindowsのバージョンではサポートされていません」と出ます。
樋口先生
中村と申します。Kh Coderを有難く使用させていただきます。
さて掲題の件に関してお伺いいたしたく、質問させていただきました。
過去に蓄積した単語と比較して、突然増加した「ホットワード」のようなものを
抽出したいと考えておりますが、よい方法はございますでしょうか。
(現在は過去のデータからリストを作成し、頻出語を除外した上で、
共起ネットワークを作成するという手順で試しています。)
ヒントをいただければ再度当方で調査したいと思っています。
お手数ですがご教示の程よろしくお願いいたします。
Currently, the size of "Config" window of co-occurrence network will change depending on selected options. It can be annoying that users have to manually adjust the window size with mouses.
This is the error I get for the hierarchical cluster analysis. I used the kokoro.xls file here.
R Version: 3.5, x86_64 Using un-threaded functions... Connected to MySQL 8.0, khc31. ignore: 19,20,21,..... 0 wallclock secs ( 0.17 usr 0.02 sys + 0.01 cusr 0.01 csys = 0.21 CPU) Data matrix for R: 71 words x 1215 docs Statistics::R::Bridge::pipe::read_processR, Sleep and Retry! Statistics::R::Bridge::pipe::read_processR, Retry: output file: /Users/alessia/Desktop/3alpha15/config/R-bridge/khc31_word_cls_1.png done: 00:00:07
KH Coder Version
3.Alpha.15 + commit 9e9adbf
from source code
OS
macOS Mojave 10.14.1
Is this also an issue with the R or maybe gPath version?
Thank you so much for your help
お世話になっております。
添付のExcelで、①ペンケース・②玉コロ・③ダンベル・④バット・⑤パズルと5つのワードがあり、それぞれのワードに対する評価がありまして
(評価は、例えば一番左の列の
①ペンケースならテーブルに置ける、しっくりくる…
②玉コロならネーミングと見た目が可愛い、つるつる手触りが良い、気持ち良い…
など)
Corderに読み込むテキストに上記エクセルをそのままコピペすると
全部のワードに対する評価がごっちゃになって出てきてしまうのですが
それぞれ
ペンケースの評価
玉コロの評価
ダンベルの評価
…
というように、ワード毎に評価を得た
共起ネットワークを作りたい場合、何か良い方法はありますでしょうか?
お使いのOS:Mac OS 10.12.6
KH Coderのバージョン:3
ざっと過去の投稿を確認させて頂きましたが、同様の事象が発生していなかったため、質問させて下さい。
■お使いのKH Coderのバージョン
3.Alpha.16
■KH Coderのインストール先フォルダ(解凍先フォルダ)
C:\khcoder3
■どんなエラー・不具合・問題ですか?
KH Coder起動時にmysqld.exeからアプリケーションエラーが出力される。
アプリケーションエラーが出力されるものの、KH Coder自体は起動する。
■どのように操作すればその問題を再現できますか?
KH Coder起動時に毎回出力される
■エラー・メッセージ
mysqld.exe - アプリケーションエラー「アプリケーションを正しく起動できませんでした(0xc000007b)。[OK]をクリックしてアプリケーションを閉じてください」
■その問題はチュートリアルの漱石「こころ」データでも同様に発生しましたか?
起動時の問題であるため、試行していない
■その問題を再現できるファイル(群)
チュートリアルの漱石「こころ」データでは問題が生じない場合、もし可能であれば、その問題を再現できる分析対象ファイル等を添付してください。
起動時の問題であるため、試行していない
■お使いのOS
Windows10
はじめまして。お忙しいところ恐れ入りますが、以下ご確認のほどよろしくお願いいたします。
3.Alpha.15f [Perl 5.18.2, Perl/Tk 804.034]
/Users/*****/Downloads/khcoder-master
前処理を実行すると、エラーが出ないまま結果が返って来ず、各メニューのクリックも反応しなくなる
/Users/*****/Downloads/khcoder-master
で perl kh_coder.pl
を実行してKH Coderを起動無し
新規プロジェクト作成時に kokoro.xls ファイルを参照していますが、
下の画像のように、プロジェクトのファイル名が変わっている点が気になります。
******:khcoder-master ******$ perl kh_coder.pl
Perl/Tk: 804.034
Locale: ja_JP.SJIS
This is KH Coder 3.Alpha.15f on darwin.
CWD: /Users/******/Downloads/khcoder-master
R Version: 3.5, x86_64
Using un-threaded functions...
Conv: 0 wallclock secs ( 0.22 usr + 0.01 sys = 0.23 CPU)
Connected to MySQL 8.0, khc8.
Data dir: /Users/******/Downloads/khcoder-master/config/khc8/
Connected to MySQL 8.0, khc8.
Checking icode (jp2)... utf8
MySQL: FLUSH
↓
KH Coderを終了すると
sh: line 1: 28470 Killed: 9 /usr/local/bin/R --slave --vanilla < start.r > output.log
が追加される
はい
Mac OS High Sierra 10.13.3
Dear Professor,
I am using Kh Koder version 3.Alpha.15f on Windows 10, my code file (txt file) works fine on some (XLS files), but with a specific file (same xls format) keeps showing an error and by closing the error the program shutdowns as shown in the attached photo (I can't understand the error), could you please help me in understanding the error, very thankful in advance!
樋口先生
はじめまして。
最新バージョンの共起ネットワークで「中心性媒介」の項目がなくなっていますが、分析において「不要」とご判断されたという理解でよろしかったでしょうか?
SCREENさんの昔の資料や、別の方に対する樋口先生のコメントで「(場合によって)サブグラフ検出よりもと中心性媒介の方が解釈しやすい」というのがあり、それ以来、教訓にしてきましたもので。
今後活用させていただくなかでの参考にご教示いただけないでしょうか。
皆さま、樋口先生
はじめまして。突然の質問失礼致します。
タイトルの通り、「前処理データの整合性が失われました。genkei-hyosobun」というエラーが解決できずに困っています。恐れ入りますが、皆さまにご助言を頂けないかと思い質問させて頂きました。
###やったこと
http://www.koichi.nihon.to/cgi-bin/bbs_khn/khcf.cgi?no=50&mode=allread
こちらを参考に「'」「"」「\」「|」「<」「>」を削除しました。
また、チュートリアルの漱石「こころ」データでは問題なく下処理を行えました。
Windows 7
3.Alpha.14[Perl5.14.2, Perl/Tk 804.03]
参考までにコンソール?のスクリーンショットと元データを添付させて頂きます。また、文字コードはSJISです。
自分で出来ることは一通り試したつもりですが…解決の足がかりが見えなくて苦労しています。
ご助言を頂ければ大変助かります。どうぞよろしくお願いします
Hello,
I am using KHCoder 3.alpha.13, under Windows 64bits.
Analysing very large texts, I keep on getting memory size error messages on the console when I try to run networks. Like these below:
What would the solution be? Increase the allocated memory size? I did not find a way to do it.
Many thanks!
質問内容
先日のチュートリアルセッションに参加させていただいたものです。
2週間あまり問題なく使用できていたのですが、急にエラーが発生して使用不可となっています。
旧掲示板を検索してみましたが、解決しないので投稿させていただきます。
■KH Coderのバージョン
→3.Alpha.16 [Pearl 5.14.2, Pearl/Tk 804.03]
■KH Coderのインストール先フォルダ(解凍先フォルダ)
→C:\khcoder3
■どんなエラー・不具合・問題ですか?
→起動後、プロジェクトの「開く」・「新規」でエラーになる。
■どのように操作すればその問題を再現できますか?
→(1)メニューから「プロジェクト」「開く」をクリック
(2)メニューから「プロジェクト」「新規」・ファイル指定後「OK」をクリック
■その問題はチュートリアルの漱石「こころ」データでも同様に発生しましたか?
→はい
■その問題を再現できるファイル(群)
チュートリアルの漱石「こころ」データ
■使用OS
→Windows10 Mac ver. 10.14.3 マシンで VirtualBox Version 6.0.4 の環境で利用
Hello,
I try to analyze news paper articles, using texts from the asahi shinbun data base "Kikuzo II". After copying the texts and pasting them into EditPad Lite 7, I continue to apply markers h1 to h3 to the text-cluster. Then I use Windows 932: Japanese (Shift JIS) to encode the text in order to check the target text. The problem is, that even though I reinstalled KHCoder once only the markers h1 and h2 are being showed after checking the target file. Previously, there was a problem with the arrows in front and behind the h1, h2, h3 markers, which let to an error that substituted the normal arrows with bigger one. Like mentioned is the problem now, that not all marker-levels are being showed even though there was no error stated. what can I do to fix this problem?
Thank you for your reply in advance!
掲示板の使い方がわからずご迷惑をおかけしてしまい申し訳ありません。
旧掲示板にて何度かキーワード検索しましたが、答えとなるものを見つけられませんでした。
■お使いのKH Coderのバージョン
→ 2.00f [Peal 5.412,Peal/Tk 804.029]
■KH Coderのインストール先フォルダ(解凍先フォルダ)
→D:/ (使用しているUSB)
■どんなエラー・不具合・問題ですか?
「hinsi_chasen」に【23,連体詞,連体詞-一般】を付け加え語の取捨選択の項目に連体詞を組み込むことができたが、品詞分析したいテキストファイルを新規プロジェクトで読み込み、Excelにて品詞抽出をすると連体詞の項目がなく、抽出出来ていない。
■どのように操作すればその問題を再現できますか?
→記入例:
(1)「hinsi_chasen」に【23,連体詞,連体詞-一般】をサクラエディタにて編集し付け加える
(2)「プロジェクト」「新規」で対象とするテキストファイルを選択し「開く」→「OK」
(3)「前処理(R)」→「語の取捨選択」→「連体詞」を含む「未知語」「タグ」「感動詞」「その他」「HTMLタグ」以外のすべての項目にチェック→「OK」
(4)「前処理(R)」→「前処理の実行」→「OK」
(5)「処理が完了しました」→「OK」
(6)「ツール(T)」→「抽出語」→「抽出語リスト」→「品詞別」→「出現回数」→「Excel」→「OK」
(7)「連体詞」以外の項目は抽出できている
■エラー・メッセージ
なし
■コンソール・ウィンドウの表示内容
スクショの貼り付け方がわからずすみません
■その問題はチュートリアルの漱石「こころ」データでも同様に発生しましたか?
はい
■お使いのOS
Windows 10
Version number of KH Coder I use:
3.Alpha.16 [Perl 5.14.2, Perl/Tk 804.03]
Operating System:
Windows 10
I am working as produktmanagerassistant at a new webportal which is created new for selling new cars.
I.. We would be very grateful for help:
as soon as I use an othr targetfile as described in folder tutorial_en KH-Koder3 interrupt the Pre-Processing.
Many Thanks in advance for reading. i would be verry happy to recive any hint or help to run it.
KH-Koder3 interrupt the Pre-Processing in several ways:
if I use my original db-extracted long „targetfile_part_1_of_x.txt“ with thousands of lines and realy long cell-content as descriptiontext
if I use an export from Libre-office as *.xls
as *.csv kh-coder3 will not open it
new project with original db-extracted long „targetfile_part_1_of_x.txt“
-- but in Console of KHCoder comes such:
Use of uninitialized value in concatenation (.) or string at \khcoder3\kh_coder.exe>Lingua/Sentence.pm line 131,
<TRGT> line 7401.
new poject with export from Libre-office as *.xls
-- but in Console of KHCoder comes such:
SERVER.WORKER: client ended, Closing connection
This planned feature is explained here (in Japanese):
https://twitter.com/khcoder/status/967433417250947072
We would like to add [save as png] and [save as svg] buttons to D3.js visualizations.
I attach the D3.js visualization to this post as a zip file.
network.zip
Also, here is an example online:
http://khcoder.net/tmp/network/index.html
KH Coder is available under the terms of the GNU GPL v2 or later. The license of KH Coder will be applied to contributed codes.
Hello,
I study academic texts with numeric file names (001.txt, 002.txt, 003.txt and so on) qualitatively and quantitatively. For the KH Coder these files were merged into one txt-file. However, all text files unified in the single text file appear in seemingly random order. They were not merged in the order they were organized in the folder (from 001.txt to 336.txt) but appeared instead 005.txt, 003.txt, 001.txt and so on. The order of appearance might be not important for working with the KH Coder but I also would like to work with the merged text file in other contexts. Therefore my question: Is it possible to merge all files in the same order as they appear in the folder?
KH coder version 3.Alapha.14b runs on Mac OS 10.13.6.
表題の件で,「設定」の項目をクリック後,辞書を英語に対応したものに設定したいのですが,
マニュアルで示されている項目をチェックする欄が私のPC画面に表示されないので困っております。
私が使用しているPCは "Windows10 64bit"です。
どの様に対応すべきかを教えて下さい。
宜しくお願い致します。
コーディングルールについてご質問です。
あるwordでコーディングルールAとコーディングルールB両者に重複するワードがある場合両者のルールで認識されますでしょうか?それとも記述したルールの順番で1つしか認識されませんでしょうか?
Hi there,
thank you for your tool!
KH-Coder analyses the frequencies of our words!
e.g:
cardesc1 wrote this as long descriptionstring into db:
Webasto parking heater, seat heater,
cardesc2 wrote this into db:
Rear window heating, Heated steering wheel,
But KH-coder the Quantitative Content Analysis shows most frequent words, not groups of words
Please dont get my question wrong, or unprecise, but at the moment I see in KH-Coder many analyses referenced to words but not to groups of words
-- I must confess: At the moment I don't see any solid floor with the many possibilities of the tool.
We have to figure out how to automatically
from a Perl script.
Need to edit "upload" subroutine in "utils/publisher.pl".
お世話になります。mituhasiと申します。
初歩的な質問で大変申し訳ありません。
昨日、主人が代わりにコーディングルールの仕様について質問させていただきましたが、
私は大学院修士課程でインタビューの発言録を分析に掛けたく行っております。
仕様以外に、その中でコーディングルールを用いてカテゴリごとの傾向を見たく考えているのですが、
コーディングルールの作成のやり方は、あくまでも分析者の主観と仮説に基づいて設定するものなのでしょうか?インタビューなどの場合はこういう観点など決まりや一般的なルールはあるのでしょうか?
主人は「そんなの決まりはない。分析者主観によるもので、それをソフトウェアに委ねるのはおかしい」と言っていますが、指導教授はテキストマイニングについて専門外であるのですが、コーディングルールの作成のあるべきやり方について聞いていて回答に困っています。
分析者によると回答がいただければそれで結構ですし、なにか一般的なコーディングルール作成のやり方があればご教授いただければ幸いです。
Mac OS 10.13.6
2.Alpha.14b[Perl5.16.3, Perl/Tk804.032]
KH Coderで作成した共起ネットワークの中心性の値を知ることが目的です。
2019年3月のワークショップで質問させていただいた者です。あの折にいただいたご助言にしたがい、以下のように進めました。
1)自身で作成した共起ネットワークを「R Source」形式で保存しました(A1.r)。
2)「Rgui.bat」はフォルダ内になかったため、Rをインストールしました。
3)コンソール上にファイル「A1.r」をドロップした際に出現したエラーメッセージに従い、いくつかのパッケージを追加しました。(Rを使用するのは、今回が初めてです)。RStudioをインストールして、そこで作業をしています。
4)最終的に、上記エラーメッセージが表示され、この解決方法がわからなかったため質問させていただきました。
旧掲示板のNo.898も参照したのですが、コードに入る前までいけませんでした。
Rについても全くの素人のため、基本的なことを伺っているのかもしれません。
大変お忙し中恐縮なのですが、ご助言いただけましたら幸いです。
よろしくお願いいたします。
研究用にソフトを使わせていただいています。
はじめてつかっているので、tutorialやmanualを読みながら勉強しつつ試行錯誤しつつ使い方を少しずつ覚えているところです。
日本に在住ですが、韓国から持ってきた韓国語仕様のSAMSUNG ノートパソコンWindows 10 64btを使っています。
KH Coderソフトは正常に起動しており、データ分析も行いましたが、画像で保存されたデータをワードやペイントに読み込むと漢字(略字)やカタカナの調音(ー)が表示されず四角「□」になってしまいます。例えば、 プライベート→プライベ□ト、社会→社□、学校→□校
のように表示されますが、解決できるのでしょうか。
Dear Koichi,
I use the KH Coder to run correpondence analysis of words and variables. It works fine but I'm not sure whether scaling in plots is always the same. Especially if I apply for scaling "none" I have the impression that scaling in the plots vary. I mean the distance between 0 and 1 is different on axes X and Y. See:
How to read the plots? Is it a wrong impression on my side? Or how can I generate plots with axes that show the same distance between 0 and 1 (and other values)?
Best,
Axel
The version number of KH Coder: 3.Alapha.14b
My operating system: Mac OS 10.13.6
Hi all,
I've used KH Coder for word-word cooccurrence networks quite often and I understand how the relationship coefficients between words are calculated. Now I created a network to understand the association between words and an external variable (with two different values, let's say a and b). However for some words, I do not understand why they have been assigned to only a, only b or both. I investigated the total occurrence of a word with a or b, the occurrence relative to the number of documents with a or b etc. but for some words I would assign them differently than KH Coder did.
Could you maybe explain with an example how the coefficient here is calculated / how the assignment to either one of the variables or all of them works? Unfortunately I couldn't find more information about this particular network in previous discussions or the manual.
Thank you!
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.