- 開催企業:SIGNATE コンペタイトル:【学生限定】SIGNATE 22卒インターン選考コンペティション(予測モデル部門) 2021年1月〜2月 237人中5位/ゴールド クラウドファンディング資金調達の成否予測。クラウドファンディングのテキストデータから調達の成否の予測を行う。
- 開催企業:SIGNATE コンペタイトル:SIGNATE Student Cup 2021春【予測部門】 期間:2021年4月〜5月 順位:330人中5位/ゴールド 内容:楽曲のリズムや長さなどの特徴量から局のカテゴリを分類するコンペ。
- 開催企業:Solafune コンペタイトル:夜間光データから土地価格を予測 期間:2021年1月〜4月 順位:199人中2位/ゴールド 内容:地域ごとの夜に衛星から観測される光のデータから土地の価格を予測するコンペ。
- 開催企業:Kaggle コンペタイトル:CommonLit Readability Prize 期間:2021年7月 順位:3633人中295位/ブロンズ 内容:テキストデータからテキストが書かれた学年を分類を行う。
- 開催企業:SIGNATE コンペタイトル:日本取引所グループ ニュース分析チャレンジ 期間:2021年5月 順位:900人中24位/シルバー 内容:ニュース情報から株価を予測する。
- 開催企業:SIGNATE コンペタイトル:日本取引所グループ ファンダメンタルズ分析チャレンジ 期間:2021年3月 順位:1443人中39位/シルバー 内容:銘柄情報・株価情報・ファンダメンタル情報等を駆使して、各東証上場企業の株価の最高値および最安値の予測。
- 開催企業:SIGNATE コンペタイトル:【学生限定】SIGNATE 22卒インターン選考コンペティション(コンペ設計部門) 期間: 2021年1月〜2月 順位:入賞 内容:コンペの設計を資料にまとめて提出を行う。主に現状の問題点、それを解決するために使用するデータ、評価関数を考え提出する
M&Aまとめサイト
サイトM&Aのプラットフォームは数十サイトあり、サイト買取を目的とする利用者は毎日数十個のサイトをチェックする必要がある。そこで私は数十個のサイトの情報が毎日自動で更新されるまとめサイトを作成した。情報更新はアクセスが少ない時間帯に、PythonのライブラリであるScrapyを用いて情報を収集し、AWSのRDSに保存、サーバはEC2、バックエンドはDjangoを用い、フロントエンドはVue.jsでデータの呼び出しや検索を行う。運用費を賄うため、外部サイトリンクにアフィリエイトリンクを適用し、成約に結び付いた場合に報酬が出る仕様にした。最初はデザインがダサく、使用ユーザからデータが見ずらいなどの苦情があり、デザインを向上させる必要があった。そこでデザイナーの方にお願いすると同時にデザインのHTML/CSSのコーディングを別の方にお願いした。その中で、「デザインはいいがコーディングするとなると手間がかかると同時にレスポンシブ時に崩れやすくなる」ことや「フロントのコーディングがバックエンド側を考慮していないタグの使い方をしている」、「SEO的にJSで表示するとクロールされない」など様々な問題があった。しかし、それぞれが得意とする知識を出しあった結果、無事デザインがシンプルでありかつSEO的にも納得いくものを作成できた。デザイン変更後ユーザ数も増加し、月額5万円の収益を出すことに成功した。
Vue.js, Django, Scrapy , AWS
社内効率化チャットボット
インターン先でスクール事業をしている企業(後述ではA社)のチャットボットの作成を行なった。A社ではチャットサービスを用いて、生徒さん一人につき一つのチャットルームを作成し複数の講師が質問等を受け付けている。このシステムの構造上、「講師の誰ががどの質問に答えたのか」「どのような質問が多いのか」「一定時間、返信していない質問はないか」などの把握には多大な時間がかかっていた。そこで私はこれらの問題を解決するため、チャットボットの導入を行なった。チャットボットの機能としては、「全ての生徒さんからの質問をスプレッドシートでまとめて閲覧できる」「一定時間返信されていない質問は講師全員にアラートされる(時間差で計三回)」「返信された質問には返信した講師と返信内容が記録される」「スプレッドシートから返信する質問へすぐに飛べる」となる。システム側では、サービスのAPIを用いてPythonで処理を行い、得られた質問を生徒さんの情報を付与しGoogleスプレッドシートAPIに送信を行う。スプレッドシート上では、Google Apps Scriptを用いて質問の回答時間や講師が質問に答えたかどうかを監視を行い、質問回答が超過している場合には講師にアラートを送信する。インフラは運用や管理がしやすいHerokuを使用した。また、頻出する回答はスプレッドシートにコマンドと合わせて追加できる。このチャットボットを導入した結果、授業がある日以外はスプレッドシートだけを見ていれば運用が可能な状態となり、業務効率化に貢献した。さらに生徒さんごとの情報を統計的にまとめることも容易となった。
Python, GAS
ヒートマップアプリケーション
社内のLPクリック状況把握のためヒートマップ閲覧アプリケーションの作成を行った。Webページのヒートマップを用いた解析はサービスとしてある。しかし、基本的に有料でありコスト削減とカスタマイズの自由性から開発に着手した。このアプリケーションはGoogle TagManagerとGoogleAnalyticsでデータ収集とタグの埋め込み、データの保持をする。データ保持では画面幅と座標を保存する。この保存したデータをDjangoでAPI経由でデータを取得し、JavaScriptに値を渡す。JavaScriptでは取得した値をheatmap.jsを用いて描画する。このアプリケーションはクリックデータを扱うため、データ数が増えてしまい単純にデータを取得すると描画時間が増してしまう。そこで、データ描画の際にはユーザが期間を指定しヒートマップを描画する処理とした。このアプリケーションの作成によりサイトのクリック解析やユーザの傾向の分析に貢献した。
Vue.js, Heatmap.js, django
エンジニア向け本紹介SNS
Ruby, JQuery, Heroku
https://quiet-mountain-28820.herokuapp.com/
タイタニック号生存者予測サイト
Flask, Heroku, JS, 機械学習
https://peaceful-refuge-77306.herokuapp.com/
新型コロナ感染者閲覧ツール
Flask, JS
https://powerful-falls-02831.herokuapp.com/
アフィリエイトリンク検索ツール
Django, BeautifulSoup
https://limitless-dusk-09571.herokuapp.com/
出会い系被害報告サイト
Rails, JS
https://obscure-garden-90948.herokuapp.com/
求人応募数予測サイト
Flask, JS, 機械学習
https://still-cliffs-88903.herokuapp.com/
scratchを利用したゲーム作成
Scratch
https://scratch.mit.edu/projects/317693944
- Python3エンジニア認定データ分析試験
- Python3エンジニア認定基礎試験
- JDLA Deep Learning for ENGINEER
- JDLA Deep Learning for GENERAL
- AWS Certified Cloud Practitioner
- データサイエンティスト検定 リテラシーレベル
- 基本情報技術者試験
- 統計検定2級