昨今話によく出るデータアナリストやデータサイエンティスト。
そういう方々は、給与も優遇されていたりとか、非常に注目されている仕事かなと思います。
ただ、この本を読んで、勉強になり、参考になるところが多々。
現状は、別の仕事をしていますが、もともとシミュレーションを生業としていた身とすると、そうだよなと思うところが多々。
シミュレーション自体、仮説の塊。
解析対象のモデル化、材料の挙動のモデル化、さらには、負荷のモデル化など、多くのモデル化という言葉が出てきます。
モデルを作る時点である程度の仮説が入ってくる。特に、解析対象のモデル化なんて、まじめにすると解析規模が大きくなりすぎて、解析不能となるから、簡素化する作業が入ってくる。
さらん、材料の挙動も、完全に再現できるモデルなんてないから、どこか妥協点を見いだしている。
そういうのを考えると、でてきた結果自体がどう取り扱うのか?仮説が正しかったのか?など、様々なことを考えながら使っていかないといけない。
このモデル化というのが非常に悩ましい。単純なモデルというのも手だけど、どれくらいのエラーを挟むものなのかというのもわかっていないといけませんし。
単純なようでいて、非常に難しい。
本書で記載されている次の言葉がある意味、真実なのかも。
分析モデルはプラモデル
どんなに詳細にできていても、車のプラモデルはエンジンが動くわけでもない。そう考えると、なるほどなと。
あと、データをいかに分析するのか?というのがあるけども、分析するだけでは意味がない。これは機械学習でも変わらない。
コンピュータにどのようなデータを放り込むかは人間が判断します。数ある学習手法のうち、どの手法を選択するかも人間が判断します。
どういう狙いで分析をしたいのか?それについて何がいるのか?というのを考えていかないと、そして意識していかないと、分析することが主となってしまう。
それだと、現実との乖離がおこってしまい、何をしているのかわからない。そして、判断に使えなくなっていってしまう。
そういうのを考えると、分析対象に対して興味をもち、調べていく、詳しくなっていくというのをしていかないといけないということなんですねぇ。
ビックデータになると何が変わるか?
部分計測から全数計測へ
いままで、部分的なところしかできなかったのを、すべて分析できるようになった。だからこそ、次の変換が起こる。
部分計測の世界では大まかなグループ単位で予測や編別をせざるを得なかったのに対し、全数計測の世界では個人や個体の単位できめ細かい予測や判別が可能になるのです。
こう思うと、より具体的なことが効率よく手を打つことができる。そういう大きな変革になっていくんでしょう。
うーん、分析は学ぶことが多く大変だわ。。。
この本は、時期をおいてもう一度読み直したいですね。