English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية
本文はPythonの簡単なテキストタイプの検出方法について説明しています。以下に詳細を示します:
1、ファイルヘッダーに基づいて。
#BOMヘッダー付きUTFであるかどうか8ファイル def IsUtf8BomFile(pathfile): if b'\xef\xbb\xbf' == open(pathfile, mode='rb').read(3)): return True return False
2、cchardetライブラリを使用。
>>> import cchardet >>> cchardet.detect(open(pathfile, 'rb').read()) { 'encoding': 'UTF-8、'confidence': 0.9900000095367432}
Pythonに関するさらに詳しい内容に興味がある読者は、以下のサイトの特集を参照してください:《Pythonファイルとディレクトリ操作の技術集》、《Pythonテキストファイル操作の技術集》、《Python URL操作の技術集》、《Python画像操作の技術集》、《Pythonデータ構造とアルゴリズムチュートリアル》、《Python Socketプログラミングの技術集》、《Python関数の使用技術集》、《Python文字列操作の技術集》および《Pythonの入門と上級チュートリアル》
本文で述べたことが皆さんのPythonプログラムデザインに役立つことを願っています。
声明:本文の内容はインターネットから収集され、著作権者に帰属します。インターネットユーザーにより自発的に貢献し、アップロードされたコンテンツであり、本サイトは所有権を持ちません。また、人間による編集は行われていません。著作権侵害が疑われる場合は、メールを以下のアドレスに送信してください:notice#oldtoolbag.com(メール送信時、#を@に変更してください。報告をし、関連証拠を提供してください。一旦確認が取れましたら、本サイトは即座に侵害疑いのコンテンツを削除します。)