RとEZR

統計解析とグラフ作成はフリーソフト"R"とマウスで操作できるように使いやすく改良された"EZR(Easy R)"を使っています。
研究グループのリーダーであるGalateiaの論文にはRで統計解析を行ったと記載があり、何だろうと調べてみたのがきっかけです。
 
長所はやはり無料ということです(SPSSやSASは結構な値段がします)。
<"http://http://www.kenkyuu.net/comp-soft-01.htmlLink ">
そしてGalateiaのように実際に論文で使用されており、研究者に認知されている点も挙げられます。
 
Rの特徴は自分でプログラミングの作業を行うことにあると思います。
プログラミング言語を使う必要があり、初めはとっつきにくいのですが、検索すると日本語での説明も数多くあり、調べながら少しずつマスターしている段階です。
下記からダウンロードします。
<"http://https://www.r-project.orgLink ">
基本的な用語を知るためにこちらのサイトを参考にしました。
<"http://http://cse.naro.affrc.go.jp/takezawa/r-tips/r.htmlLink ">
 
もう少し簡単に統計解析をしたいと思っているとEZRというソフトもあることを知りました。
自治医科大学の先生が開発されたようです。
<"http://http://www.jichi.ac.jp/saitama-sct/SaitamaHP.files/statmed.htmlLink ">
EZRはマウスの操作で統計解析ができるので、初めてであっても比較的スムーズにできると思います。
男性骨粗鬆症のデータはEZRで統計解析をしました。
 
しかしグラフを作成するとなると思うようにできなかったため、仕方なくRを使うことにしました。
プログラミング言語がわからなくても下記をまねして入力すると箱ひげ図が苦労せずにできました。
<"http://http://stat.biopapyrus.net/graph/boxplot.htmlLink ">
デフォルトではグラフの線が細い、目盛りの数値のフォントが小さいなどあり、さらに箱をグレースケールで区別できるようにしたいと思い、下記を参考に見やすいグラフを作成しようと試みました。
<"http://http://takenaka-akio.org/doc/r_auto/chapter_12.htmlLink ">
しかし学会等で時間が迫っており時間がなく、作成したグラフのpdfをMacにインストールされているプレビューAppで上書きして論文用に作成しました。
 
Rに関してはまだわからないことばかりですが、ちゃんとプログラミングができて解析結果が出たときは達成感があります。
次の論文でグラフを作成する場合はちゃんとRからきれいなグラフが作成できるようにしたいと思っています。
easyR
EZR
NONALNUM-MuOBpOOBruOCsOODqeODlQ-E
左)Rで作成、右)左のpdfを編集

— posted by 佐田潔 at 12:12 pm   commentComment [2]  pingTrackBack [0]

今さら・・その②

統計解析を行う際にデータに正規性があるかどうかちゃんと調べていますか?
ぼくは今までやっていませんでした。
本当にレベルの低い話でブログにupするのもためらうのですが、後輩の先生方にはぼくみたいな失敗はしてほしくなく、反省をこめてここに書き留めておきます。
 
今までは度数分布表を作ってみて視覚的に判断して、パラメトリックまたはノンパラメトリックな解析にするかを判断していました。
Shapiro-Wilk検定というのを使えばデータからきっちり判断できるというところまでは情報収集を行えていたのですが、その時はツールを持ち合わせていませんでした。
 
最近RやEZRというフリーの解析ソフトを使って、グラフの作成などを行っていますが、どちらもShapiro-Wilk検定ができるようでした。
実際にやってみると男性骨粗鬆症の母集団は正規性がありました(それまでは度数分布から視覚的に正規性なしと判断し、ノンパラメトリックで統計解析をやっていました)。
 
この検定ではp値が0.05より大きいと正規分布に従うということになります。
下記にRとEZRの解析結果を添付します。
例えば、年齢の分布が下のようにやや二峰性があるようであってもp値は0.23で正規性ありとなるようです。
 
男性骨粗鬆症の統計解析を再度やり直してみても結果に大きな影響はなく安心したのですが、今回もやはり時間をロスしてしまったと思います。
統計解析のスタートの部分なので、多少時間はかかってでも納得するまで調べればよかったのですが、早く解析を結果を出したいと焦っていた(抄録の締め切りが迫っていた)、そして「正規性があるかの確信がもてなければ、”とりあえず”ノンパラメトリックで解析」という情報を鵜呑みにしていました。
 
今後大学院等で研究をスタートする予定のみなさまへ
・最初は時間がかかってでも納得いくまで調べたり、先輩に聞いたりすることをお勧めします
・中途半端な状態で先に進んでしまうと、それまでの労力と時間が無駄になるかもしれません(それもいい経験なのかもしれませんが・・)
・抄読会等では統計部分はサラッと流すことも多いですが、行っている統計解析方法など少しずつ勉強しておくといいと思います
 
今回触れたフリーソフトRやEZRは次回のブログでupしたいと思います。
 
NONALNUM-44K544Kv44Oq44O844Oz44K344On44OD44OIMjAxNi0xMS0xNjMuNTAuMDE-E
EZR
NONALNUM-UuOBp-WFpeWKm-OBl-OBnw-E
R

— posted by 佐田潔 at 10:29 pm   commentComment [0]  pingTrackBack [0]

今さら・・

朝から夜まで論文作成に時間を使っていますが、つい最近になって発覚した事実があります。
本当に今さら・・という内容で、自分が知らなかったという事実に情けなくなってしまいます。
それは文献検索サイト”PubMed”の検索対象はAbstractのみだった・・ということです(全文が対象になっていると思っていました)。
医者になって9年・・本当に驚愕の事実でした。
 
今まで文献を検索する際、PubMedをメインで使って、ほしい文献が手に入らない時は"Google Scholar"で検索していました。
ただPubMedではないけど、Google Scholarでヒットしたという文献が少なくなく、つい最近になって後者のサイトをメインで使うようになりました。
試しに同一キーワードを入れてどれぐらい文献がヒットするのかを比較したところあまりにも数が違うことに驚きました(下記参照)。
そして調べてみると、Google Scholarは全文を検索対象にしていて、PubMedはAbstractのみが対象だということを初めて知りました。
 
Google Scholarの方がヒットしやすい理由がわかって納得するというよりも、どうしてこんなことを今まで知らなかったんだろうとショックを受けました。
PubMedでほしい文献がヒットせずにいったいどれくらいの時間を費やしたんだろう・・(研究だけでなく1例報告の論文でも)。
悲しくなりました。
 
今は探している文献に短時間でたどり着くようになりました。
これは文献管理ソフトMendeleyのおかげでもあります。
後輩の先生方にはPubMedだけでなく、Google Scholarも駆使して時間と労力を節約してほしいと思います。
 
ScreenShot2016-11-09at111531AM

ScreenShot2016-11-09at111603AM

— posted by 佐田潔 at 11:27 pm   commentComment [0]  pingTrackBack [0]

T: Y: ALL: Online:
Created in 0.2737 sec.


prev
2016.11
next
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30