使实现ContentAI提取器更容易

contentaiextractor的Python项目详细描述


contentai extractor运行时python

这是一个python包,用于实现在ContentAI平台上运行的自定义提取器。在

https://pypi.org/project/contentaiextractor/

  1. Usage
  2. API Documentation
  3. Dependencies
  4. Develop
  5. Changes

使用

pip install contentaiextractor
^{pr2}$

API文档

ContentAIError Objects

^{pr 3}$

represents a contentai error

Fields

功能

下载_内容

download_content()

下载要在本地使用的内容

返回写入内容的本地路径

元数据

metadata()

返回包含输入元数据的dict

示例:

访问运行作业时提供的元数据

contentai run s3://bucket/video.mp4 -d '{ "input: "value" }'
input=contentai.metadata()["input"]

提取器

extractors()

获取针对此内容url执行的所有提取器的列表

返回字符串列表

["extractor1","extractor2"],

示例:

# get all data from all extractorsforextractorincontentai.extractors():forkeyincontentai.keys(extractor):data=contentai.get(extractor,key)

keys(extractor_name)

获取指定提取器的键列表

返回包含键列表的dict

["data.json","data.csv","data.txt,"]

示例:

keys=contentai.keys("azure_videoindexer")forkeyinkeys:data=contentai.get("azure_videoindexer",key)

获取

get(extractor_name,key)

获取特定密钥的内容

示例:

# get another extractor's outputdata=contentai.get("some_extractor","output.csv")

获取json

get_json(extractor_name,key)

获取特定键的json内容

示例:

# get another extractor's outputdata=contentai.get_json("some_extractor","data.json")

获取字节数

get_bytes(extractor_name,key)

获取以原始字节为单位的特定键的内容

示例:

# get another extractor's outputdata=contentai.get_bytes("some_extractor","output.bin")

设置

set(key,value)

设置此提取器的结果数据

可以用不同的键多次调用

值是字符串

示例:

^{pr21}$

设置json

set_json(key,value)

设置此提取器的结果数据

可以用不同的键多次调用

价值可以是任何东西

示例:

data={}data["foo"]=barcontentai.set_json("output",data)

设置字节

set_bytes(key,value)

设置此提取器的结果数据

可以用不同的键多次调用

值为字节

示例:

some_file=open("some-file","rb")contentai.set_bytes("output",some_file.read())

保存结果

save_results()

立即保存结果,而不是等待进程退出

解析\u content\u url

parse_content_url()

从内容url提取详细信息

退货

支持以下content url格式:

依赖关系

pip install -r requirements.txt

发展

 Choose a make command to run

  build    build package
  deploy   upload package to pypi
  docs     generates api docs in markdown

释放

要向pypi发布新版本,请在setup.py中增加版本号,标记提交并推送。在

变化

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Neo4j Java API,如何缩小搜索结果?   使用Guice将java延迟绑定到实例   使用Java将嵌套记录写入BigQuery   OCommandSQLParsingException:从java代码向orientdb服务器发送查询时,没有名为“gremlin”的函数   java何时使用Hibernate缓存(第二级)?   java Android ByteArrayBuffer的字节数大于容量   java您好,我使用的是安卓 studio,我遇到了关于重复依赖项的错误,但我不确定要在哪里解决这个问题   java如何在SpringAOP中停止方法执行   java匿名新视图。OnClickListener()可以替换为lambda   java如何使用GSON解析JSONArray   在终端中执行twoclass java项目   java想要更改javafx中另一个fxml控制器类的标签文本   java如何解析复杂的JSON并使用改进将其放入列表   resultset Java如何读取多个数据行