torchtext.utils¶
报告挂钩¶
download_from_url¶
- torchtext.utils.download_from_url(url, path=None, root='.data', overwrite=False, hash_value=None, hash_type='sha256')[source]¶
下载文件,带有逻辑(来自 tensor2tensor)用于 Google Drive。返回下载文件的路径。 :param url: 文件的 URL 链接。(默认为 None) :param path: 文件将保存的路径 :param root: 用于存储文件的下载文件夹(默认为 .data) :param overwrite: 覆盖现有文件(默认为 False) :param hash_value: URL 的哈希值。(默认为
None)。 :type hash_value: str, 可选 :param hash_type: 哈希类型,在“sha256”和“md5”之间选择。(默认为"sha256")。 :type hash_type: str, 可选示例
>>> url = 'http://www.quest.dcs.shef.ac.uk/wmt16_files_mmt/validation.tar.gz' >>> torchtext.utils.download_from_url(url) >>> url = 'http://www.quest.dcs.shef.ac.uk/wmt16_files_mmt/validation.tar.gz' >>> torchtext.utils.download_from_url(url) >>> '.data/validation.tar.gz'
extract_archive¶
- torchtext.utils.extract_archive(from_path, to_path=None, overwrite=False)[source]¶
解压存档。 :param from_path: 存档的路径。 :param to_path: 解压文件的根路径(from_path 的目录) :param overwrite: 是否覆盖已存在文件(默认为 False)
- Returns:
已提取文件的路径列表,即使未被覆盖。
示例
>>> url = 'http://www.quest.dcs.shef.ac.uk/wmt16_files_mmt/validation.tar.gz' >>> from_path = './validation.tar.gz' >>> to_path = './' >>> torchtext.utils.download_from_url(url, from_path) >>> torchtext.utils.extract_archive(from_path, to_path) >>> ['.data/val.de', '.data/val.en'] >>> torchtext.utils.download_from_url(url, from_path) >>> torchtext.utils.extract_archive(from_path, to_path) >>> ['.data/val.de', '.data/val.en']