Pythonでテキストの種類を簡単に検出する2方法【ファイルヘッダーおよびcchardetライブラリに基づいて】

本文はPythonの簡単なテキストタイプの検出方法について説明しています。以下に詳細を示します：

1、ファイルヘッダーに基づいて。

#BOMヘッダー付きUTFであるかどうか8ファイル
def IsUtf8BomFile(pathfile):
  if b'\xef\xbb\xbf' == open(pathfile, mode='rb').read(3)):
    return True
  return False

2、cchardetライブラリを使用。

>>> import cchardet
>>> cchardet.detect(open(pathfile, 'rb').read())
{ 'encoding': 'UTF-8、'confidence': 0.9900000095367432}

Pythonに関するさらに詳しい内容に興味がある読者は、以下のサイトの特集を参照してください：《Pythonファイルとディレクトリ操作の技術集》、《Pythonテキストファイル操作の技術集》、《Python URL操作の技術集》、《Python画像操作の技術集》、《Pythonデータ構造とアルゴリズムチュートリアル》、《Python Socketプログラミングの技術集》、《Python関数の使用技術集》、《Python文字列操作の技術集》および《Pythonの入門と上級チュートリアル》

本文で述べたことが皆さんのPythonプログラムデザインに役立つことを願っています。

声明：本文の内容はインターネットから収集され、著作権者に帰属します。インターネットユーザーにより自発的に貢献し、アップロードされたコンテンツであり、本サイトは所有権を持ちません。また、人間による編集は行われていません。著作権侵害が疑われる場合は、メールを以下のアドレスに送信してください：notice#oldtoolbag.com（メール送信時、#を@に変更してください。報告をし、関連証拠を提供してください。一旦確認が取れましたら、本サイトは即座に侵害疑いのコンテンツを削除します。）

基本チュートリアル