専門演習 テーマ研究
東京国際大学 商学部 データサイエンスコース
2026年04月21日
以下の3点を明らかにする
| 項目 | 内容 |
|---|---|
| 対象期間 | 2024年1月〜12月(365日間) |
| 時間粒度 | 1時間単位 |
| レコード数 | 8,760件 |
| 目的変数 | 1時間あたりの利用数 |
| 説明変数 | 気温、湿度、風速、降雨、曜日、時間帯 |
| 項目 | 内容 |
|---|---|
| 利用データ | 東京都シェアサイクル事業オープンデータ(※実際の出典に置き換えてください) |
| 気象データ | 気象庁 過去の気象データ検索(※実際の出典に置き換えてください) |
| 取得日 | 2025年○月○日 |
| 前処理 | src/generate_data.R で実行 |
気温と利用数の関係
| 手法 | 特徴 | 利点 | 欠点 |
|---|---|---|---|
| 線形回帰 | 線形モデル | 解釈が容易 | 非線形に弱い |
| LightGBM | 勾配ブースティング | 高精度 | 解釈が複雑 |
| ステップ | 処理内容 |
|---|---|
| 1 | 初期予測 F₀ を設定 |
| 2 | 残差(実測値 − 予測値)を計算 |
| 3 | 残差を予測する決定木 f₁ を学習 |
| 4 | 予測を更新:F₁ = F₀ + η·f₁ |
| 5 | 再び残差を計算 |
| 6 | 決定木 f₂ を学習 → F₂ = F₁ + η·f₂ |
| … | M 回繰り返し |
| 最終 | 最終予測 F_M を出力 |
| 順序 | 工程 | 詳細 |
|---|---|---|
| 1 | データ生成 | 合成データ(365日×24時間) |
| 2 | 前処理 | 欠損値処理・特徴量作成 |
| 3 | 分割 | 訓練 80% / テスト 20% |
| 4a | 線形回帰 | ベースラインモデル |
| 4b | LightGBM | 勾配ブースティングモデル |
| 5 | 精度比較 | MAE / RMSE / R² |
| 6 | 変数重要度 | Gain による評価 |
| モデル | MAE | RMSE | R² |
|---|---|---|---|
| LightGBM | 12.41 | 15.56 | 0.92 |
| 線形回帰 | 39.59 | 48.94 | 0.19 |
LightGBM が全指標で線形回帰を上回る
研究成果
今後の課題
![]()
Hanako Tokoku @ Tokyo Int’l Univ.