自然言語処理用にデータの文字コードの統一をしたい。

予算
2,500
納品希望日
ご相談
募集期限
募集終了 締切日 2022年5月1日 /
掲載日 2022年4月29日
応募状況
応募人数 4
契約人数 0
閲覧数 104
用途・種類
データクレンジング
対応範囲
相談して決めたい
用意してあるもの
開発言語

募集内容

依頼の概要・目的・背景
【目的】pythonでtsvファイルを読み込もうとすると、UnicodeDecodeError: 'utf-8' codec can't decode byte 0x90 in position 39: invalid start byteというエラーが出ます。 【依頼背景】解析を行うにあたり、読み込みのための文字コード統一が必要となりました。文章に対し、データの前処理を行なって、適切にutf-8に統一して読み込めるようにしてください。 【追加情報】費用については、2500円ほどでお願いできればと思います。(売上金残高です。) 先生曰く、別のエディターでUTF8に変換 Cotエディター使用、行数が多いとパンク 仕方ないからWindowsのテラパットを使うそうです。ご参考になればと思います。
添付ファイル
参考URL
求めるスキル
特記事項

応募者一覧

応募者
応募日時
tetsuro8128
2022/04/29 17:04
masashi012
2022/04/29 18:13
akirao1954
2022/04/30 08:03

募集内容についての質問

募集者情報

発注実績
0
発注件数
0%
発注率
0%
取引完了率
認証状況
本人確認
機密保持契約(NDA)