今週のAsk-A-Data-Scientistコラムには、母校であるSwarthmoreの大学1年生からの質問があります。データサイエンス関連の問題をrachel@fast.aiにメールで送信してください。質問は明確さと簡潔さのために編集されていることに注意してください。以前の投稿は次のとおりです。
- 勉強時間をどのように集中させるべきですか?どうすれば専門を見つけることができますか?
- サービスとしての機械学習(MLaaS)は機能しますか?博士号が必要ですか?
- キャリアを変えてデータサイエンティストになる方法
- データサイエンスおよびエンジニアリングチームを構成する方法
- ディープラーニングに興味のある学生へのアドバイス
Q:私は現在、スワースモアカレッジの新入生ですが、機械学習とディープラーニングに非常に興味があります。私は今学期に人工知能を取りたかった。残念ながら、CS部門が関心の急上昇に追いつくことが困難であったため、新入生はクラスに参加しませんでした。
私は現在、機械学習に関するAndrew NgのCourseraコースを受講しており、2〜3週間で終了します。次に、ハッカーのニュースで見たfast.aiMOOCを利用する予定でした。
忙しすぎるかもしれませんが、MLと提案された計画について質問してもいいですか?NgのCourseraコースとfast.aiの後、機械学習を継続して学習するにはどうすればよいですか?唯一の2つの選択肢は、1。)研究と2.)UPennの大学院レベルのコース(スワースモアから(特に1年生として)入学するのは非常に難しいようです)のようです。何かアドバイスをいただければ幸いです。
A:時間がかかる場合がありますが、一般的には質問に喜んでお答えします(受信トレイ、受信トレイ)。技術的な質問については、最初にfast.aiフォーラムで質問することをお勧めします。あなたが私たちのコースを受講していなくても、私たちのフォーラムにはたくさんの興味深い議論があります。キャリア関連または一般的な質問については、データサイエンティストの質問の列でよく答えます。
- SwarthmoreまたはUPennのAIクラスがなくても、ディープラーニングや詳細を学ぶ方法に関係することが不足することはありません。私たちのMOOCは完了するのに70時間の学習が必要であり、私たちが始めたKaggleコンテストのいずれかに興味を持った場合は、はるかに長い時間を費やすことができます。パート2は数か月以内にリリースされますが、これは同様の時間の約束ですが、さらなる研究のためのさらに多くのサイドアベニュー、読むべき推奨論文、および作業を拡張する方法があります。
- 可能であれば、公式クラスを受講しますが、公式クラスの資格やリソースは必要ありません(大学にいない人や、AIクラスを提供していない大学にいる人には、心配しないでください。あなたはそれらを必要としません!)。大学院の学位を持たない経済学専攻の学生の1人が、権威あるGoogleBrainレジデンシープログラムに受け入れられました。別の学生は、私たちのコースの資料に基づいて新しい不正検出技術を開発し、彼の仕事でボーナスを受け取りました。他の何人かは、インターンシップや求人を受け取ったり、現在の職場のチームをよりエキサイティングな機械学習プロジェクトに切り替えたりしています。
クレデンシャルは、特にあなたが技術の過小評価された少数派である場合(したがって、より厳しい監視に直面している場合)、ドアに足を踏み入れるのに役立つことがあります。
しかし、あなたの名前を取得してそこに取り組むためのさらに効果的な方法はたくさんあります:
- 人気のあるブログ投稿を書いてください(これについては以下で詳しく説明します)。
- 面白いアプリを作成してオンラインにします。
- 上の他人の質問に役立つ回答を書く学ぶ機械学習subredditまたは上fast.aiフォーラムを。利他主義は私にとって重要ですが、それは私が他人を助けることを勧める理由ではありません。あなたが学んだことを他の人に説明することは、あなた自身の理解を固めるための重要な部分です。
- 独自の実験を行い、ブログ投稿またはgithubを介して結果を共有します。学生の1人であるSlavIvanovは、スタイルの転送にさまざまなオプティマイザーを使用することについて質問しました。ジェレミーはそれを試してみることを提案し、スラブは彼が見つけたものについて素晴らしいブログ記事を書いた。この投稿はredditで非常に人気があり、Slavの作品がより広く知られるようになりました。
- オープンソースに貢献する。ここでは、学生の1人がTensorFlowに貢献した彼の前向きな経験について共有しています。彼は3行のコードで、Android上のTensorFlowのバイナリサイズを10MB未満に削減しました。
一般に、興味のあるもの(ディープラーニングを使用するもの)のサイドプロジェクトを開始して、それに取り組むことをお勧めします。
なぜあなた(はい、あなた)はブログを書くべきですか
私が若い自分に与える一番のアドバイスは、もっと早くブログを始めることです。ブログを書く理由は次のとおりです。
- それは履歴書のようなものですが、それよりも優れています。ブログの投稿が求人につながった人が何人かいることを私は知っています!
- あなたが学ぶのを助けます。知識を整理することは、常に自分のアイデアを統合するのに役立ちます。あなたが何かを理解しているかどうかのテストの1つは、それを他の誰かに説明できるかどうかです。ブログ投稿はそれを行うための素晴らしい方法です。
- ブログの投稿から、会議への招待状と講演への招待状を受け取りました。TensorFlowが好きではないことについてのブログ投稿を書いたTensorFlowDev Summit(すごかったです!)に招待されました。
- 新しい人に会います。私が書いたブログ投稿に返信してくれた何人かの人々に会いました。
- 時間を節約する。電子メールで質問に複数回回答するときはいつでも、それをブログ投稿に変換する必要があります。これにより、次に誰かが質問したときに共有しやすくなります。
インスピレーションを得るために、コースのパート2の学生からのブログ投稿のサンプルを次に示します。
- 深層学習のための線形代数チートシート
- さまざまな視点からのCNN
- 怠惰でありながら迅速な方法でディープラーニングマシンをセットアップする
- 非芸術的なスタイルの転送(またはキャプテンピカードの顔を使用してカニエを描く方法)
私は上記のブログ投稿をすべて楽しんだし、また、どれも威圧的すぎるとは思わない。それらはアクセス可能であることを意図しています。
ブログを始めるためのヒント
ジェレミーは何年もの間ブログを始めるべきだと提案してきました、そして私は「私は何も言うことがありません」と答えます。これは真実ではありませんでした。私が言いたかったのは、自信がなく、自分が書くことができるものは、自分よりも専門知識やライティングスキルの高い人たちによってすでに書かれているような気がしたということです。
それは大丈夫であることがわかりました!あなたの投稿は、読んだり共有したりするために、驚異的なものである必要はなく、斬新である必要もありません。私が始めたとき、私のライティングスキルはかなり弱かったですが(大学で数学とCSを勉強することを選んだ理由の一部は、それらのコースが必要なライティングの量が最も少なく、ラボもなかったためです)、私のスキルは時間とともに向上しています。
最初の投稿を開始するのに役立つヒントを次に示します。
- あなたが好きな他のブログ投稿、記事、または研究へのリンクのリストを作成し、簡単な要約を書くか、それらについてあなたが特に好きなものを強調してください。私の最初のブログ投稿の一部は、私がそのようなリストを作成したことから来ました。なぜなら、私が素晴らしいと思った投稿や記事をもっと多くの人が読んでいないとは信じられなかったからです。
- 参加した会議や受講しているクラスで学んだことを要約します。
- 2回書いたメールは、ブログ投稿にする必要があります。さて、他の誰かも興味を持っていると思う質問があったら、それを書いてみます。
- 完璧主義者にならないでください。私は最初のブログ投稿に9か月を費やしましたが、それはバイラルになり、それ以来、読者数の新しい最低値を繰り返し打っています。2017年の私の個人的な目標の1つは、自分の文章をより早く投稿することであり、投稿する前にあまり執着しないことです。
- あなたは、人々があなたの一歩後ろにいるのを助けるのに最適な立場にあります。素材はまだあなたの心の中で新鮮です。多くの専門家は、初心者(または中級者)であることがどのようなものであったかを忘れており、最初にそれを聞いたときにトピックが理解しにくい理由を忘れています。あなたの特定の背景、あなたの特定のスタイル、そしてあなたの知識レベルの文脈はあなたが書いているものに異なるひねりを与えるでしょう。
- 1年前に何があなたを助けたでしょうか?一週間前に何があなたを助けたでしょうか?
- NYC、シカゴ、またはサンフランシスコの女性の場合は、女性のソフトウェア開発者がブログ投稿を書いたり、会議で話したり、オープンソースに貢献したりすることを奨励するグループであるWrite / Speak / Codeのローカルチャプターに参加することをお勧めします。
- 怒る。ついに私が書き始めたきっかけは、有名人が私を怒らせた何かを言ったときでした。とても怒っていたので、彼の考えが間違っていたすべての方法を説明しなければなりませんでした。
- 実際のロジスティクスについて疑問がある場合は、Mediumを使用すると非常に簡単に開始できます。もう1つのオプションは、JekyllページとGithubページを使用することです。私は2つのブログを持っていて、それぞれに1つ使用しているので、個人的に両方をお勧めできます。
MOOCを利用することで正しい道を歩み、サイドプロジェクトを追加し、オンラインコミュニティに参加し、ブログを書くことで、他の人と学び、会う機会がさらに増えます。