English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

Pythonでテキストの種類を簡単に検出する2方法【ファイルヘッダーおよびcchardetライブラリに基づいて】

本文はPythonの簡単なテキストタイプの検出方法について説明しています。以下に詳細を示します:

1、ファイルヘッダーに基づいて。

#BOMヘッダー付きUTFであるかどうか8ファイル
def IsUtf8BomFile(pathfile):
  if b'\xef\xbb\xbf' == open(pathfile, mode='rb').read(3)):
    return True
  return False

2、cchardetライブラリを使用。

>>> import cchardet
>>> cchardet.detect(open(pathfile, 'rb').read())
{ 'encoding': 'UTF-8、'confidence': 0.9900000095367432}

Pythonに関するさらに詳しい内容に興味がある読者は、以下のサイトの特集を参照してください:《Pythonファイルとディレクトリ操作の技術集》、《Pythonテキストファイル操作の技術集》、《Python URL操作の技術集》、《Python画像操作の技術集》、《Pythonデータ構造とアルゴリズムチュートリアル》、《Python Socketプログラミングの技術集》、《Python関数の使用技術集》、《Python文字列操作の技術集》および《Pythonの入門と上級チュートリアル》

本文で述べたことが皆さんのPythonプログラムデザインに役立つことを願っています。

声明:本文の内容はインターネットから収集され、著作権者に帰属します。インターネットユーザーにより自発的に貢献し、アップロードされたコンテンツであり、本サイトは所有権を持ちません。また、人間による編集は行われていません。著作権侵害が疑われる場合は、メールを以下のアドレスに送信してください:notice#oldtoolbag.com(メール送信時、#を@に変更してください。報告をし、関連証拠を提供してください。一旦確認が取れましたら、本サイトは即座に侵害疑いのコンテンツを削除します。)

基本チュートリアル
おすすめ