抑扬格:莎士比亚文本的数据提取和渲染库。

iambic的Python项目详细描述


抑扬格:莎士比亚文本的数据提取和渲染库。:滚动:

imageimageimage图像imagecodecovcode style:black

让电脑为你做艰苦的工作吧!抑扬格提供:

  1. 自动计算行数的最精确方法。
  2. 自动跟踪在任何场景中说话的角色。
  3. 确定性的、可重复的结果,能够存储 作为json的数据,具有严格定义的用于传递连接的模式 或者在运行时之间存储在本地或nosql数据库中。
  4. < > >

    安装

    为了安装最新版本,只需pip3 install-u iambic

    此库需要Python3.6或更高版本。

    这是什么?

    抑扬格最初被设想为一种翻译工具 将莎士比亚的文本转化为可操作的信息,即:

    1. 这出戏有多少台词?
    2. 在这出戏里,一个角色讲几行?
    3. 哪些角色说话,哪些场景和行为?
    4. < > >

      作为实现的结果,这个工具可以被应用 任何文本体都遵循其语法分析。

      工作原理

      在莎士比亚的作品中,每一行文字都有意义 沟通量超过了单个单词。像这样的, iambic的根对象是单独的行或节点。 每个节点都基于简单的 句法规则。这些规则可以分解为 以下逻辑组:

      <H3>1。场所< /H3>

      alocale将由标题格式(h1-5)和 表示的前向操作中的逻辑中断 玩。这些可以被认为是可能显示 在目录中,可以包括:

      • 动作
      • 场景
      • 序言结语

      一个动作可能有人y嵌套场景序言,以及 结语章节。

      场景将始终嵌套在act动作下。一 场景包含演讲、对话和动作。

      a序言结尾可以嵌套在 动作可能有也可能没有场景动作的结构

      <H3>2。行动和方向

      动作和方向将用斜体表示 任何长度的段落,表示 发生在舞台上。它们可以包括:

      • 字符操作(操作
      • 舞台方向(方向
      • 入口/出口(入口出口

      action对象表示特定 通常在 演讲。如果这些单词不止一个(例如aside), 他们要么用代词来指代这个字符,要么 从开始…。为了理解 给定段落是一个操作 除了 斜体字。他挥舞着剑 朱丽叶])。

      a方向更简单-它只是一个阶段 方向,意思是一段文字 任何角色之间的一些舞台上的动作。一 方向将始终以第三人称书写 全知和参考字符的名称和表示 只是用斜体字。例如:繁荣他们战斗哈姆雷特 刺伤克劳迪斯

      入口出口通常以 输入退出,或退出并斜体显示。

      <H3>3。人物角色

      人物角色对象在其自己的类别中,最初是 在一段对话之前用黑体字表示。EX:

      哈姆雷特 不是这样,大人,我太阳光了。

      一旦一个人物角色被创建,这个对象就会被跟踪到 剩下的部分。

      <H3>4。行< H3 >

      最后是文章的重点。过滤掉所有其他的 句法符号,不管剩下什么都被认为是 一行对话对话框对象表示单个 一行口语单词,分组在较大的语音中 对象,与角色说话和 直接嵌套在场景序言结尾 发生的对象。

      模式

      完整的模式规范是用json编写的 架构7.0,可以找到 这里

      文档

      即将提供完整的文档!

      如何贡献

      1. 检查打开的问题或打开新问题以启动 围绕功能理念或缺陷展开讨论。
      2. 在github上为您的问题或fork创建分支 存储库 在github上开始对主控形状进行更改 分支,
      3. 编写一个测试,显示错误已修复或 该功能按预期工作。
      4. 发送一个pull请求并在维护程序中设置bug,直到它得到 合并并发布。):< <李>< > >

        欢迎加入QQ群-->: 979659372 Python中文网_新手群

        推荐PyPI第三方库


热门话题
二进制字符串的java NumberFormatExceprion   java如何在Neo4j中查找/匹配/选择标识符名称   java哪一年的日期与原始年份相同?   java什么时候JAXB可以用于Json而不是XML?   java使用PayPal权限API进行PayPal支付   java Getting error在使用安卓 vision api扫描二维码时加载图像失败   java直接突出显示RichTextFX中的一个文本范围   java Resolve@RegisteredAuth2AuthorizedClient,其令牌在spring Security 5.2的spring server之外获得。十、   yyyymmddhhmmss的Java正则表达式   java我试图将google recaptcha与spring mvc集成,但GreCaptCharResponse总是返回false。这里有一些代码   java使用JsonPath将文本转换为json   java无法解析符号。Maven依赖项已就位,但代码为红色   java使用循环查找范围内具有不同数字的数字   java这个SwingWorker是否不重用ThreadPoolExecutor中的线程?