強化学習の報酬設計の方法を教えてください。ツールの見方、使い方なども含みます

予算
5千
1万
納品希望日
2026年2月10日
募集期限
募集終了 締切日 2026年2月10日 /
掲載日 2026年1月31日
応募状況
応募人数 1
契約人数 0
閲覧数 194
依頼範囲
システム・ソフトウェアサポート、ハードウェアサポート、ITコンサルティング
開発言語
Python

募集内容

募集内容
強化学習の報酬に関して、 ① → 報酬の構造候補を一気に出し、 →「そもそも何を評価すべきか」を早期に発見。 ② → 学習が進まない理由を即可視化 → 報酬が悪いのか/環境が悪いのかを切り分ける
添付ファイル
参考URL
求めるスキル
特記事項
経験者優遇
品質重視

応募者一覧

応募者
応募日時
SHIRO ALAM OFFICE
2026/01/31 13:01

募集内容についての質問

募集者情報

takenchishingo
4.7 (78)
発注実績
121
発注件数
20%
発注率
78%
取引完了率
認証状況
本人確認
機密保持契約(NDA)