東京都内シェアサイクル利用数の
予測モデル構築に関する研究

専門演習 テーマ研究

東国 花子

東京国際大学 商学部 データサイエンスコース

2026年04月21日

目次

  1. 研究の背景
  2. 研究の目的
  3. データの概要
  4. 利用数の時系列
  5. 気温と利用数の関係
  6. 曜日・時間帯パターン
  7. 分析手法の概要
  8. LightGBM の仕組み
  9. 分析パイプライン
  10. 精度比較
  11. 予測結果の可視化
  12. 変数重要度
  13. 考察
  14. まとめと今後の課題
  15. 参考文献

研究の背景

  • 都市部でシェアサイクルの利用が急速に拡大している
  • 環境負荷の低い移動手段として注目 (Fishman 2016年)
  • 効率的な運営には利用数の予測が不可欠
  • 気象条件・曜日・時間帯が利用パターンに影響 (Eren と Uz 2020年)
  • 東京都内に特化した予測モデルの構築事例は限られている

研究の目的

以下の3点を明らかにする

  1. シェアサイクル利用数を予測するモデルを構築する
  1. 線形回帰とLightGBMの精度を比較する
  1. 利用数に影響を与える要因を特定する

データの概要

項目 内容
対象期間 2024年1月〜12月(365日間)
時間粒度 1時間単位
レコード数 8,760件
目的変数 1時間あたりの利用数
説明変数 気温、湿度、風速、降雨、曜日、時間帯

データの出典

項目 内容
利用データ 東京都シェアサイクル事業オープンデータ(※実際の出典に置き換えてください)
気象データ 気象庁 過去の気象データ検索(※実際の出典に置き換えてください)
取得日 2025年○月○日
前処理 src/generate_data.R で実行

利用数の時系列

気温と利用数

気温と利用数の関係

  • 気温が高いほど利用数が増加
  • 約20°C以上で利用数が安定
  • 低温時は利用が大幅に減少
  • 正の相関が認められる

曜日・時間帯パターン

分析手法の概要

手法 特徴 利点 欠点
線形回帰 線形モデル 解釈が容易 非線形に弱い
LightGBM 勾配ブースティング 高精度 解釈が複雑

LightGBM の仕組み

勾配ブースティングの反復手順(η は学習率)
ステップ 処理内容
1 初期予測 F₀ を設定
2 残差(実測値 − 予測値)を計算
3 残差を予測する決定木 f₁ を学習
4 予測を更新:F₁ = F₀ + η·f₁
5 再び残差を計算
6 決定木 f₂ を学習 → F₂ = F₁ + η·f₂
M 回繰り返し
最終 最終予測 F_M を出力

分析パイプライン

順序 工程 詳細
1 データ生成 合成データ(365日×24時間)
2 前処理 欠損値処理・特徴量作成
3 分割 訓練 80% / テスト 20%
4a 線形回帰 ベースラインモデル
4b LightGBM 勾配ブースティングモデル
5 精度比較 MAE / RMSE / R²
6 変数重要度 Gain による評価

精度比較

モデル MAE RMSE
LightGBM 12.41 15.56 0.92
線形回帰 39.59 48.94 0.19

LightGBM が全指標で線形回帰を上回る

予測結果の可視化

変数重要度

考察

  • LightGBM は線形回帰より全指標で高精度
    • 非線形な利用パターンの捕捉に有効
  • 時間帯が最も重要な予測変数
    • 通勤・通学の移動パターンを反映
  • 気温が2番目に重要
  • 降雨は利用数を大幅に減少させる
    • 需要予測で重要なファクター

まとめと今後の課題

研究成果

  • LightGBM による利用数予測モデルを構築
  • 線形回帰比で RMSE 約30%改善
  • 時間帯・気温が最重要変数

今後の課題

  • 実データでの検証
  • ステーション別予測
  • 深層学習との比較
  • リアルタイム予測への拡張

参考文献

Eren, Emir, と Volkan Emre Uz. 2020年. 「A Review on Bike-Sharing: The Factors Affecting Bike-Sharing Demand」. Sustainable Cities and Society 54: 101882. https://doi.org/10.1016/j.scs.2019.101882.
Fishman, Elliot. 2016年. 「Bikeshare: A Review of Recent Literature」. Transport Reviews 36 (1): 92–119. https://doi.org/10.1080/01441647.2015.1033036.
James, Gareth, Daniela Witten, Trevor Hastie, Robert Tibshirani, と Jonathan Taylor. 2023年. An Introduction to Statistical Learning: with Applications in R. 2nd 版. Springer. https://doi.org/10.1007/978-3-031-38747-0.
Ke, Guolin, Qi Meng, Thomas Finley, ほか. 2017年. LightGBM: A Highly Efficient Gradient Boosting Decision Tree」. Advances in Neural Information Processing Systems 30 (NeurIPS 2017), 3146–54.