BASEプロダクトチームブログ

ネットショップ作成サービス「BASE ( https://thebase.in )」、ショッピングアプリ「BASE ( https://thebase.in/sp )」のプロダクトチームによるブログです。

機械学習

BERTを利用した商品カテゴリの推論基盤を作りました

この記事はBASE Advent Calendar 2022の19日目の記事です。 はじめに こんにちは、DataStrategyチームの竹内です。 今回はBASEで作成されたショップが扱っている商品のカテゴリを機械学習モデルを使って推論するための取り組みについてご紹介いたします。 は…

機械学習チームで論文読み会を実施してみました(A ConvNet for the 2020s解説)

BASEの機械学習チームで論文読み会を実施してみました こんにちは。BASEのDataStrategy(DS)チームでエンジニアをしている竹内です。 DSチームではBASEにおける様々なデータ分析業務をはじめ、機械学習技術を利用した検索、推薦機能のサポート、商品のチェ…

誤分類コストを考慮した機械学習モデルの考え方

BASE Advent Calendar 2021 はじめに コスト考慮型学習とは Cost-Sensitive Learningの手法 コスト行列 閾値の調整による誤分類コストの反映 実際のデータセットを用いた例 まとめ 参考文献 はじめに この記事はBASE Advent Calendar 23日目の記事です。 こ…

Amazon Personalizeでリアルタイムに変化をするレコメンドを試してみました!

この記事はBASEアドベントカレンダー2021 17日目の記事です。 はじめに DataStrategyチームの杉です。 ショッピングアプリPay IDではさまざまなショップでの商品購入が可能です。 "探す"タブにはおすすめ機能がついており、利用者にあった商品やショップのレ…

BASEアプリのリコメンドにGraph Neural Networkを導入するよ(予定)

この記事はBASE Advent Calendar 2020の21日目の記事です。 はじめに お久しぶりです。BASEビール部部長(兼Data Strategyチーム)のbokenekoです。 今年はほんと辛い1年でしたね。コロナで全くビール部の活動ができませんでした。 その反動で通販でクラフトビ…

Data Strategy チームの HackWeek の導入とその効果

この記事はBASE Advent Calendar 2020の4日目の記事です。 devblog.thebase.in こんにちは、BASEのデータストラテジーチームを担当している鈴木(id:rmarl)です。 普段は、機械学習エンジニアやデータエンジニアメンバーと一緒にデータ活用の推進を行ってお…

不均衡データ分類問題をDNNで解くときの under sampling + bagging 的なアプローチ

不均衡データ分類タスクをDNNで解きたくなった際、under sampling + bagging 的なアプローチをしている論文を見つけたのでご紹介。

時間のかかる推論をSQSとワーカーでどうにかするインフラ構築

この記事はBASE Advent Calendar 2019の22日目の記事です。 devblog.thebase.in こんにちは、Data Strategyチームのid:tawamuraです。BASEには今年の8月に入社し、今月で5ヶ月目になります。 DSチームでは、ネットショップ作成サービス「BASE」のデータを集…

Prophetのモデル式を1から理解する

論文に書かれているProphetのモデル式を噛み砕いて説明してみました。

テキストによる商品のカテゴリ分類でCutMixを試してみた

この記事はBASE Advent Calendar 2019 17日目の記事です。 devblog.thebase.in こんにちは、DataStrategyの杉です。 DataStrategyではデータを用いて問題解決を行なっていたり、より使いやすいサービスのための改善をしています。10日目の記事として類似商品…

ONNXを使って推論速度を高速にしてみる

この記事はBASE Advent Calendar 2019の15日目の記事です。 devblog.thebase.in DataStrategyの齋藤(@pigooosuke)が担当します。 ONNXの概要 Open Neural Network Exchange(ONNX)とは、機械学習モデルを表現するフォーマット形式のことです。ONNXを活用する…

類似商品APIで使っている近傍探索のツールをNGTからfaissに切り替えたお話

この記事はBASE Advent Calendar 2019の10日目の記事です。 devblog.thebase.in お久しぶりです。 BASEビール部部長(兼Data Strategyチーム)の氏原です。 1年ちょっと前にYahoo!の近傍探索ツールNGTを使って類似商品APIをつくるという記事を書きました。あ…

Data Strategyチームの最近の取り組み

この記事はBASE Advent Calendar 2019の5日目の記事です。 devblog.thebase.in こんにちは、Data Strategyマネージャーの鈴木です。社内には鈴木が沢山いますので、普段は下の名前(りょう)で呼ばれています。 Data Strategyチームでは、BASEに存在するデー…

特集コンテンツの自動生成とレコメンドサービスの取り組み

こんにちは。BASE株式会社 DataStrategyに所属している齋藤(@pigooosuke)です。 先日、ショッピングアプリ「BASE」内の主要コンテンツである商品特集を自動で運用するように切り替えました。 今までは、「ワンピース特集」「ピアス特集」など、トレンド・テ…

BASEを支える機械学習エンジニアチームをゼロからつくってきた1年

出典: https://unsplash.com/photos/36Vbwo1OiZU BASEでData Strategyチームのマネージャーをしている鈴木僚です。 Data Strategyチームのミッションは、データを使ってプロダクトを成長させ、戦略的に事業を推進させることです。 EC事業では、オーナーズ(…

クラスタリングで時系列予測はできる? 〜Twitterの株価を予測してみた〜

Twitterの株価予測を題材に、クラスタリングで時系列予測ができるか挑戦しました。

Data Strategy GroupのAPI開発の挫折とその後

BASE Advent Calendar 2018 18日目 「BASE Advent Calendar 2018」の18日目の記事です。 devblog.thebase.in お久しぶりです。BASEビール部部長(& Data Strategy Group)の氏原です。 アドベントカレンダーの季節が来て今年も終わりかと実感しているところ…

分位点回帰を使って、「その回帰予測どれぐらい外れるの?」を説明する

これは、「BASE Advent Calendar 2018」の6日目の記事です。 DataStrategyの齋藤(@pigooosuke)が担当します。 devblog.thebase.in はじめに 機械学習エンジニアの人は、分類や回帰などの課題に取り組むにあたって、偉い人や導入先の部門から「その予測どれぐ…

ALOCCを使った「文字画像」を判別する試み

どうもお久しぶりです。BASEビール部部長の氏原です。最近急に涼しくなりましたね。ハイアルなベルギービールでも飲んで温まるといい季節ですよ。 さて、今回もビールの話はとりあえず置いておいて現在Data Storategy Groupで取り組んでいる内容として、今年…

機械学習にアノテーションを活用して、商品検索の関連キーワード機能を作る

DataStrategyの齋藤(@pigooosuke)です。 ネットショップ作成サービス「BASE」は60万店舗のショップが利用しており、ショッピングアプリ「BASE」のユーザーは、新着商品、キーワード検索、関連商品、商品特集などを介して気になる商品を見つけることができ…

Yahoo!の近傍探索ツールNGTを使って類似商品APIをつくる

はじめまして、BASEビール部部長の氏原です。BASEのData Strategy Groupで機械学習エンジニアをしています。 今回初登場ということで、暑いときにいいサワーエールのお話でも......といきたいところですが、ここは開発ブログということなので仕方ありません…