データサイエンティスト講座を受けて

f:id:nisayama:20200603141916p:plain

komichi17です。

初投稿です。よろしくお願いいたします。

今回、データサイエンティスト講座を4/18(土), 19(日), 5/9(土), 10(日)の4日間で3時間ずつのスケジュールで受講しました。
アフリカ出身の方が講師として、オンラインでご教授いただきました。
講師の方は、主にアフリカの国々で理数系科目の講師をされた後、日本の大学でAIの研究をされた経歴を持たれていて、データサイエンティストとしてかなりスキルがあるかたでした。

受講経緯

会社から今回の講座の受講希望を募っており、参加を希望したところアサインいただきました。

受講を希望した動機

私がアサインされるのは意外だったので少し戸惑いましたが、プログラミング言語習得のための講習を受けるのは新卒で入社した会社が用意したJava研修以来でした。(10+?年か前かな…)
当時興味津々でこの業界にトライしたものの、研修でエディターにコーディングをする際に"インデント"は何のために行うのかというあまり時間をかけて考えなくてもよいところを悶々と悩み、Javaを学ぶ上で最も大事なオブジェクト指向を理解できるまでにはその時至らず…

と、言語の習得にかけては苦い思い出もあり、それでも未知の技術をどんどん習得していくことができるこの業界に魅力を感じながらここまでやってきましたので、今回もその想いで受講を希望しました。

講座の内容

もともと当社と取引をしている企業が準備されている「データサイエンティスト講座」の導入部を今回受講させていただくことになりました。
カリキュラムは以下の通りとなります。

  • Lecture 1: Introduction - Course Overview
  • Lecture 2: Python’s libraries for Data Science tasks ( Numpy, Matplotlib, Pandas ), Git, GitHub,
  • Lecture 3: Web Scraping, Regular Expressions, Data Reshaping, Data Cleanup, Pandas
  • Lecture 4: Exploratory Data Analysis (EDA)

Lecture 1

データサイエンティストとは、機械学習とはなど資料を元に説明

Lecture 2

Pythonの基本的知識やNumpyなどのフレームワークの使い方

Lecture 3

Webスクレイピングとは何かを、あるサイトを例に出しながら実際にスクレイピング
取得したデータをの扱い方や精査の仕方など

Lecture 4

データをグラフィカルに分析するためのポイント

講座で使用された環境・ツール

Anacondaにより利用したアプリケーション

  • Jupyter Notebook

受講してみての感想

◆内容

Pythonで用意されているライブラリ「Numpy」機能の使用方法を説明いただいている際は、さすがデータ分析が得意な言語なのだなぁと思いつつ、Numpyの特に「Matrix algebra」からは統計に関する難しい関数がいくつも説明いただき、追いついていくのが段々と苦しくなっていました。
(この辺で新卒の時に受けていた研修の苦悩を思い出すことも…)
しかし、その都度講師に質問することができたことと、講師の方が質問に対してかなり丁寧に答えてくだださったことから、なんとかついていけました。

◆講師

外国籍の方による日本語でしたので、時々聞き取れない場面があり不安になりそうでしたが、なるべく密に質問しコミュニケーションを計ることにより解決していきました。

◆教材

画面共有してくださるテキストは日本語ではなく英語が大部分を占めており、受講の際は訳して理解するのに普通に手間取りましたが、受講後になり「これからドキュメントも英語が公用に使用されてくるのだなぁ」と自分の英語の未熟さを嘆きながら今後の英語勉強の発奮材料としました。

今後の展望について考えていること

宿題も終えこのブログを書いている今週末に講義内容をおさらいもしましたが、ひとつの技術をマスターするのは簡単では無いことは久しぶりに実感しました。
今回は12時間のデータサイエンティスト講座編の導入部の受講でしたが、出来れば続きの講義も受けていき、さらには機械学習編も受けてみたいなと興味が出てきました。
今回の受講をきっかけに、データサイエンスをマスターすることを私の今後の目標にし、今後当社の社員がデータサイエンティストとして学んでいく際の何かの助けになれればと切望しています。

データサイエンス、機械学習の観点からも株価予測、不動産価格予測など面白くなりそうな機能を作成することが可能となる分野なので、今後のブログでも紹介出来たらと思っております。


このブログはBulletGroupが運営しております。 BulletGroupについてはこちら bltinc.co.jp