BASEプロダクトチームブログ

ネットショップ作成サービス「BASE ( https://thebase.in )」、ショッピングアプリ「BASE ( https://thebase.in/sp )」のプロダクトチームによるブログです。

Data Strategy チームの HackWeek の導入とその効果

f:id:rmarl:20201204123246p:plain この記事はBASE Advent Calendar 2020の4日目の記事です。

devblog.thebase.in

こんにちは、BASEのデータストラテジーチームを担当している鈴木(id:rmarl)です。 普段は、機械学習エンジニアやデータエンジニアメンバーと一緒にデータ活用の推進を行っております。

昨年のアドベントカレンダーでもDSチームの取り組みについて書かせていただきましたが、今年はより開発対象を拡大し、以下のような領域について開発を進めております。

  • ネットショップ作成サービス「BASE」をご利用のショップオーナー様への自動アドバイス、ショッピングアプリ「BASE」のユーザーへおすすめ商品のレコメンド
  • 時系列分析やそれを活用したモデルの構築(BASE BANK)
  • 異常検知
  • 検索エンジンの精度向上
  • データ基盤の構築とBIツールの利用促進

このように開発領域が広がっていくにつれて、集中して技術習得する時間がないという課題が見えてくるようになりました。

それに対して年初からHackWeekを導入し実際に目に見える効果も出てきたので、ここで共有したいと思います。

HackWeekとは?

一定期間業務を離れて、一つの研究テーマに集中する時間を設ける事です。 それにより、チーム全体の開発力の底上げを期待しています。

元々は2017年にデータサイエンティスト向けの教育プランの論文として発表された物がベースになっております。

arxiv.org

ここにもあるように、HackWeekは集中する事によってもたらす以下の効果を期待しています。

  • 最先端の方法論の習得
  • ピアラーニング
  • 実務との融合(論文にあるコラボレーションもその一つ)

上記に加え、Google社の20%ルールのような「内製化による技術革新のブースト」、ハッカソンのような「短期間における発想力の強化」も期待できます。

BASEでの活用方法

そもそもがチーム全体の開発力の底上げを期待しているため、実業務を優先しつつ無理のない範囲で、メンバー主体でHackWeekに立候補して頂いています。

個々のメンバーの希望を元に、以下のような条件で定めています:

  • 対象テーマ
    • 先述の開発領域において、将来的に活用しそうな学習モデルの検証
    • 最新の論文内容を実データで検証
    • 過去の開発時に、後で検討するとしたテーマの検証
  • 日程について
    • 期間は原則1週間
    • 期間終了後、速やかに報告会を行う
    • リリース前・繁忙期を避ける
    • サポート問い合わせ対応期間は避ける
  • 環境の準備
    • 検証のためだけの有料サービス利用も可
    • sandboxとして、ML専用サーバーに空きがあれば占有も可

また、HackWeekに入る事を宣言したメンバーに対しては、その期間の間、以下のような勤務体系としています。 弊社では特に導入で問題はなかったのですが、この辺りの調整を要するケースもあるかと思います。

  • HackWeekに専念するため、出社は任意
    • 現在はWork From Home実施のため、基本はリモート勤務となっております
  • そのメンバーが担当していた通常業務は、出来る限り他のメンバーが協力して代行する
  • それでも緊急対応が入ったら、その対応の日数分、報告会を延期する
  • どのような内容を実施したか進捗ログをまとめておき、報告会で共有する。

報告会

HackWeek終了後、報告会は以下の要領で実施します。

  • 検証完了・中途問わず、発表する
  • 報告20~30分、質疑応答20~30分と1時間で開催
  • 可能であれば、デモ環境も用意する
  • 報告用文書は必須とする

どういったテーマが選ばれるか?

今年に入ってから20件近く報告会が開催されましたが、一部を抜粋すると以下のようなテーマがありました。

  • ナレッジ収集のためのグラフDB活用法
  • 商材動画における物体検知
  • 学習にobjectの位置情報を利用しないobject detection Grad-CAM
  • カテゴリー・属性抽出の手法
  • 音声フレームワークの検証

どのような成果が出てきているか?

一番の成果としてはピアラーニングの効果が大きく、メンバーの気付きが開発中案件に応用される例も出てきています。 また、メンバーは任意のテーマを選ぶことが出来るようにしてあるのですが、実務と結びついたテーマも多かったです。メンバー曰く「実務中に試してみたかったけど時間や採算性の問題で保留にした課題をこの期間で検証したい」との事で、こちらもHackWeekの成果の方が効果があるという事で実務に組み込まれた例もあります。

まとめ

HackWeek実践のメリットを取り上げてきましたが、BASEにおいてはデータ活用を非常に重要視した取り組みをおこなっており、その実現に対して柔軟な体制をしいております。 今後とも、データ活用を通じて皆様の利便性に貢献していければと思います。

明日は、SREチームの長澤さん(id:ngsw)です!お楽しみに!