-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathintroduction.qmd
130 lines (81 loc) · 3.98 KB
/
introduction.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
---
title: "データの読み込みから可視化"
subtitle: "Kanazawa.R #2"
author: "伊東宏樹"
date: 2024-11-23
format:
revealjs:
theme: [default, custom.scss]
slide-number: true
embed-resources: true
editor: visual
---
## 自己紹介
- 氏名: 伊東宏樹
- 3月まで森林総合研究所勤務
- 4月から個人事業主([伊東生態統計研究室](https://ito4303.sakura.ne.jp/))
- データ解析、執筆・翻訳、研修講師などお引き受けいたします。
- 出版物: 『[BUGSで学ぶ階層モデリング入門](https://www.kyoritsu-pub.co.jp/book/b10003729.html)』『[生態学のための階層モデリング](https://www.kyoritsu-pub.co.jp/book/b10003301.html)』(以上共訳)など
## 本日の内容
- Rについて
- データの読み込み
- 整形・変形
- データの可視化
- 地理空間データ
## Rとは
- オープンソースの、統計計算とグラフィックのためのシステム
- <https://www.r-project.org/>
- 言語と環境(グラフィックなど)
- 2万を超えるパッケージ
- 専門的な統計的手法もだいたいある
## RStudio
- Posit社が開発している統合開発環境
[![(Posit: RStudio IDE)](images/RStudio.png){style="border: 1px solid blue; border-radius: 4px; padding: 8px; box-shadow: 5px 5px 10px black;" width="684"}](https://posit.co/downloads/)
## データ読み込みと可視化
[![データサイエンスのモデル (Wickham H. et al. (2023) R for Data Science (2nd ed.), CC-BY-NC-ND 3.0)](images/base.png)](https://r4ds.hadley.nz/intro#fig-ds-diagram)
## データの読み込み (Import)
パッケージ利用で各種データファイルをRに読み込むことができる
- CSV, TSV: readrパッケージなど
- Excel: readxlパッケージなど
- ODS: readODSパッケージ
- JSON: jsonliteパッケージ
- Parquet: arrowパッケージ
など
## データの整形 (Tidy)・変形 (Transform)
- tidyr, dplyrパッケージなど(tidyverseメタパッケージに含まれている)
- 整然データにする
- 1つの変数が1つの列
- 1つの観測が1つの行
- 1つのタイプの観測ユニットが1つのテーブル
- 1つの値が1つのセル
- 整然データを、利用目的に応じて変形する
## 可視化 (Visualize)
グラフ作成のパッケージ
- デフォルトのgraphicsパッケージ (base graphics)
- [ggplot2](https://ggplot2.tidyverse.org/)パッケージ
- [plotly](https://plotly.com/r/)パッケージ
- [tidyplots](https://jbengler.github.io/tidyplots/reference/)パッケージ
など
## 地理空間データ
- 最近では、[**sf**](https://cran.r-project.org/package=sf)**パッケージ**を使うことが多い[^1]
- GISデータ規格の[OGC simple feature access](https://www.ogc.org/publications/standard/sfa/)対応
- 読み込み対応
- シェープファイル, GeoJSON, GPX, KMLなど
[^1]: <https://notchained.hatenablog.com/entry/2017/01/06/213333>
## 実演
::: {style="margin-top: 4em; text-align: center;"}
実演画面をご覧ください
:::
## おわりに
わからないことは
- 公式マニュアル
- 参考文献
- コミュニティ
- Slack:r-wakalang 参加方法は <https://github.com/tokyor/r-wakalang>
- mandaRa <https://scrapbox.io/mandaRa/>
- ChatGPT
- 検索
## 参考文献
- [RユーザのためのRstudio[実践]入門(改訂2版)](https://gihyo.jp/book/2021/978-4-297-12170-9)(松村優哉・湯谷啓明・紀ノ定保礼・前田和寛, 技術評論社, 2021年)
- [データ分析のためのデータ可視化入門](https://www.kspub.co.jp/book/detail/5164044.html)(キーラン・ヒーリー(著), 瓜生真也・江口哲史・三村喬生(訳), 講談社, 2021年)
- [Rではじめる地理空間データの統計解析入門](https://www.kspub.co.jp/book/detail/5273036.html)(村上大輔, 講談社, 2022年)