文档云的文档查看器集成到plone中。

collective.documentviewer的Python项目详细描述


简介图片::https://www.wildcardcorp.com/logo.png
:高度:50
:宽度:382
:alt:由wildcardcorp.com制作
:align:right


此包将documentcloud的查看器和pdf处理集成到plone中。

示例查看器:https://www.documentcloud.org/documents/3219331-foia-request-17-oig-015.html


功能
--


-非常好的文档查看器
-ocr
-可在ocr文本上搜索
-可用于许多不同的文档类型
-集合。芹菜集成
-许多配置选项
-用于显示的pdf相册视图一组PDF



除显示PDF外,还将显示:

--
-word
-excel
-powerpoint
-html
-rtf




安装要求
--

-docsplit:http://documentcloud.github.com/docsplit/
-graphicsmagick
-ghostscript(首选9.0版)
-poppler
-tesseract(可选)
-pdftk(可选)
-openoffice或libreoffice(可选,用于doc、excel、ppt等类型)
-md5或md5sum命令行工具


/>
强烈建议结合此软件包安装和配置collective.celeri
。这样做将异步管理所有pdf
转换过程,以便用户在保存文件时不会被延迟太多时间




settings
--


>可以通过控制面板项配置产品
`document viewer settings`.

选项:

血清扫描文档中的文本。此过程可能会很慢,因此如果不需要对PDF进行OCR,则可以禁用此过程。
对于添加到网站的PDF文件,自动选择"布局"
对于添加到网站的PDF文件,自动选择"文档查看器"显示。
"自动转换"
添加和修改PDF文件时,自动转换。
如果要将自动布局文件类型与自己的灵活内容类型一起使用,则应自动转换为文档查看器的类型。您需要编辑zmi/portal_types/yourtype中的fti,以便在
可用的视图方法中添加"documentviewer",并在架构中设置主字段,例如:


<;field name="myfile"marshal:primary="true"
type="plone.namedfile.field.namedblobfile">;



文件存储集成
这可能需要安装一个本地nginx,仅用于在
plone服务器上提供文件存储。但是,您可以创造性地使用文件存储


2)因为在plone的删除操作中,它可以被中断,并且操作系统系统上文件的删除不能在事务中完成,
任何文件都不会被删除。但是,有一个操作可以放入cron任务中来清理文件存储目录。只要调用
url`http://zeoinstace/plone/@dvcleanup filestorage`.



您的翻页器视图可以工作,但以后添加到站点的文件都不会转换为翻页器。


若要转换现有视图,在每个启用翻页器的文件上都会有
be一个"文档查看器转换"按钮,您可以单击该按钮手动将翻页器转换为文档查看器。


若要转换所有现有视图,请转到ZMI中的"门户"设置,升级,
选择"集合"。单击"文档查看器",显示旧的升级,此时应该有一个"全部升级"`运行步骤。



cent os/red hat上的安装
--------------------------


eric tyler提供了centos的特殊说明。
您可以通过"git hub repo文件位置"访问它们<;https://github.com/collective/collective.documentviewer/blob/master/centos-install.rst>;` `.

installation
----------
如果在linux/ubuntu/debian机器上,遇到如下错误::


/var/lib/gems/1.9.1/gems/docsplit-0.7.2/lib/docsplit/image-extractor.rb:51:in` exists?':无法将nil转换为字符串(typeerror)
从/var/lib/gems/1.9.1/gems/docsplit-0.7.2/lib/docsplit/image廑extractor.rb:51:在"确保在转换中"


这是因为ruby docsplit库对temp
文件夹访问和临时文件的删除有问题。只需运行以下命令:

sudo chmod 1777/tmp&;sudo chmod 1777/var/tmp


,然后重试文档的转换





development
--

normal flow:

git clone git@github.com:collective/collective.documentviewer.g它

cd collective.documentviewer




bin/buildout
changelog
==


<5.0.4(2019-01-09)
----

-使用"plone.api.portal.get"而不是"gettoolbyname"
[vangheem]



5.0.3(2018-12-11)
———————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————w(`` convert_all_unerted```)转换所有尚未转换的文件。
[thet]

-如果未设置全局请求,则不要中断。修复71
[ale-rt]

-修复冗余条件
[ale-rt]

-处理plone.app.contentTypes文件索引。
[thet]

-为plone.app.contentTypes添加自定义迁移程序,并在迁移到plone.app.contentTypes时避免转换。
[thet]

-添加su支持nixos下的libreoffice,它使用不同的文件夹名
作为转换目录
[pyseal]




5.0.1(2017-07-16)
----



-修复pdfs第一页上的问题中断缩放
[obct537]


5.0.0(2016-09-02)
--------

-提取OCR文本而不是完全错误时出现日志异常
[vangheem]


5.0.0a1(2016-08-05)
----


-plone 5/仅现在灵活
[vangheem]


4.1.0(2017-05-15)
----


-保存转换的PDF和将其发布为pdf/dump.pdf和@@pdf。
[jaroel]

>4.0.14(2016-08-01)
----


-添加了意大利语翻译
[keul]

-修复了chrome上的javascript问题:预期的全局变量"sidebar"不是全局变量
[keul]

-处理冲突错误异步进程中的s更好地
[vangheem]


4.0.13(2016-07-22)
----


-向屏幕读取器隐藏文档查看器,因为它们将无法为pdf页制作
img>;标记。
[vangheem]

<4.0.12(2016-07-22)
-

-搜索时处理错误
[vangheem]



4.0.11(2016-07-12)
----


-处理内容上未找到blob
[vangheem]


4.0.10(2016-06-30)
----


-修复版本

<4.0.9(2016-06-30)
----
>-删除句柄文件以清理文件
[vangheem]

-修复无法隐藏侧边栏
[vangheem]



>4.0.8(2016-06-21)
----


-使用复选框进行自动布局
[vangheem]


4.0.7(2016-06-20)
-

-do不转换图像类型
[vangheem]

-能够完全隐藏贡献者
[vangheem]



对象,设置导程图像后,可以检索图标
[vangheem]



4.0.4(2016-01-25)
----


-修复芹菜对话,显示其仍在转换
[vangheem]


4.0.3(2015-09-30)
-


-修复导入namedfile,恢复较旧的plone兼容性
[vangheem]

<4.0.2(2015-09-30)
----


-修复对原型的支持
[vangheem]


<4.0.1(2015-09-28)
----

-添加lead image support
[vangheem]

-能够使用cOllective.排队任务用芹菜
[vangheem]

-修复异步监视器注册
[pilz]



4.0.0(2015-09-09)
----


-修复plone 5兼容性
[vangheem]

-升级jquery.imgareaselect至最新版本
[vangheem]

-upgrADE文档查看器到最新版本
[vangheem]

-不再支持从wildcard.pdfpal和wc.pageturner升级。使用3.x series
[vangheem]

>3.0.3(2015-07-29)
----


-在javascript变量文件上设置响应头。防止Chrome上的JS错误。
[vangheem]

<3.0.2(2014-05-31)
----


-修复与collective.geo不兼容的错误。*
[vangheem]



<3.0.1(2014-05-08)
----


-添加德语翻译
[jhb]





<3.0a1(2013-09-03)
----

-增加灵活性兼容性。要在您的内容类型上启用它,您需要
定义一个主字段,并在可用的视图
方法中添加documentviewer,请参阅文档。
[vincentfretin]

-fix:可以修改的用户现在可以查看信息消息
和"注释/节"功能。
[thomasdesvenain]

-如果可能,显示参与者全名。
参与者和组织在一个范围内。
[thomasdesvenain]

-避免将非ascii字符替换为(?)在OCR过程中
对于非英语语言。
[thomasdesvenain]

-对于未转换的内容,纯文本索引是固定的。
[thomasdesvenain]


-当当前生成文档的新版本时,
用户将收到状态消息通知。
[thomasdesvenain]



2.2.2b3(2013-05-31)
——————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————.2.2b2(2013-05-31)
---------

-修复在使用blob存储和文本索引时禁用的错误
[gbastien]



<2.2.2b1(2013-05-31)
----

-仅在受支持时使用defaultfactory。对于较旧版本的zope.schema
[vangheem]



2.2.2a1(2013-05-31)
----


-添加了法语翻译
[gbastien]

-添加了全局和本地设置中的enable_indexation参数
修复:https://github.com/collective/collective.documentviewer/issues/21
[gbastien]

-使本地设置与全局设置一致
修复:https://github.com/collective/collective.documentviewer/issues/22
[gbastien]



2.2.1(2013-03-12)
----

-修复与最新libreoffice和docsplit的使用。
修复:https://github.com/collective/collective.documentviewer/issues/11


-不需要在
plone实例上安装docsplit来显示查看器。
文档已在另一个
客户端上转换。
[vangheem]



>2.2(2013-02-06)
----



-fix z-index on viewer
[damilgra]



<2.2b2(2013-01-10)
----

-fix getsite imports for plone 4.3




2.2b1(2013-01-06)
----


-切换到使用ofs.interfaces.ifolder进行文件夹视图
[vangheem]

-转换PDF时,显示现有的(如果可用)。
[vangheem]


-将转换按钮移动到操作
[vangheem]



2.2a2(2012-10-01)
------——

-另一个子站点修复
[vangheem]



<2.2a1(2012 xx xx)
——


-测试plone 4.2兼容性。
[hvelarde]

-处理子站点

>2.1b2(2012-06-22)
——

-更好地处理移动文件夹around

2.1b1(2012-06-22)
----



-能够混淆文件存储的文件路径


>2.0.4(2012-06-21)
----


-修复清理文件位置

-修复文件资源的潜在传输错误



2.0.3(2012-06-13)
————

——在查找现有作业之前检查配额集。


2.0.2(2012-06-12)
————


-包含contentmenu zcml dependency

-升级转换现在将尝试并修复错误转换



2.0.1(2012-05-15)
—————-——

-在组视图上固定批处理

2.0.1b1(2012-05-14)
—————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————/>
1.5.1(2012-04-30)
----


-修复文件资源的安全性



1.5.0(2012-04-29)
----


-无更改

1.5.0b1(2012-04-27)
----

-能够将作业移动到队列前面

-使用门户网站alog而不是uid-catalog,因此安全性
检查适用于资源url。



1.4.2(2012-04-24)
----



-无更改,第一个最终版本



1.4.1b3(2012-04-23)
----


-在将db同步到之前创建本地编录和索引防止
冲突错误。

-将重定向超时添加到转换信息页



1.4.1b2(2012-04-23)
----


-确保关闭打开的文件描述符

-将"原始文档(pdf)"更改为"原始文档"

-在转换后发出事件rsion

-仅当manager

-convert按钮应适用于尚未选择
布局的文件

-如果
输出较大,请使用communicate而不是wait with popen。防止死锁。



1.4.1b1(2012-04-23)
————————————————————————————————————————————————————————————————————————————————————————————————————————————————————————nversion

-新的文件存储结构,防止过多文件
位于一个目录中



<1.4b1(2012-04-21)
----


-选择文本或页面时修复全屏按钮。

-能够自定义批大小


<1.4a2(2012-04-20)
----

-确保不使用带有空格的文件



<1.4a1(2012-04-20)
----


-能够检测PDF中是否已经有文本它
,如果是的话就不进行ocr操作。



1.3b2(2012-04-20)
----

-使用jquery而不是$()




<1.3b1(2012-04-20)
----

-默认ocr处于关闭状态,因为它非常慢les

-能够覆盖查看器的宽度



1.3a3(2012-04-20)
----


-修复卸载
[vangheem]




1.3a2(2012-04-19)
----


-修复未安装的异步错误
[vangheem]



1.3a1(2012-04-19)
----

-确保在数据库同步后初始化目录
对于大型PDF。
[vangheem]

-更好地与PDFPAL和PageTurner集成,因此从这些产品升级很容易。
[vangheem]



1.2a2(2012-04-19)
------

-修复为异步队列设置自定义配额
[vangheem]


-修复组视图清除按钮
[vangheem]

-添加对替代MD5SUM二进制文件的支持
[vangheem]


<1.2A1(2012-04-19)
----

-修复全屏页面错误
[vangheem]

-更好地与配额设置进行异步集成
[vangheem]


-查看用于转换的异步队列
[vangheem]


-为门户目录中的OCR数据编制索引
[vangheem]

-更好地使用搜索进行PDF组视图
[vangheem]

-更好地处理大文件r
[vangheem]

-通过存储要检查的文件的散列来检查文件是否已被转换。
[vangheem]

-能够删除文档查看器转换任务
[vangheem]

-添加清理已删除文件存储文件的功能
plone file对象。
[vangheem]


>1.1a1(2012-04-18)
----


-添加pdf文件夹相册视图
[vangheem]


-修复异步集成
[vangheem]


<1.0a2(2012-04-17)
----

-添加控制面板图标
[vangheem]

-修复卸载过程
[vangheem]

-更改映像类型不会导致现有映像失败。
[vangheem]



1.0a1(2012-04-17)
----


-初始版本

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java JList侦听器找不到符号   多点触摸跨平台java应用程序(Windows、Mac和Linux(Ubuntu)(可能是Android))   在UnitTest中找不到java类加载器资源   java当我尝试在Eclipse中运行我的minecraft mod时,我总是遇到这个错误,这是什么意思?   内部有一个同步块的静态方法,在java中阻止整个类?   不支持java操作:具有BillableStatus的费用在采购中应具有AccountBasedExpenseLineDetail行的CustomerRef   java运行时常量池GC集合   java无法解析配置“:app:\u debugApk”的所有依赖项。找不到名为“default”的配置   在GCP计算引擎中托管Neo4j的java   java如何从BroadcastReceiver更新片段选项卡?   线程“main”组织中的java异常。冬眠注释异常:@org。冬眠注释。表引用未知表:ProductForPractice   在Java/Groovy中嵌入处理   java Android REST教程/示例项目   java我可以在同一测试中在一个模拟器上启动应用程序,在另一个模拟器上启动移动浏览器吗?   java如何更改通知横幅的方向?   安卓 Java帮助实现Firebase授权   if else之后的rs.next()中出现java错误?