备忘录:十五年内的开发计划
计划,还没有开始。
1 利用Image Grabber II类似软件对影片进行画面截取,研究设置成多少帧进行截取可以最大程度上保证整部影片的完整性,也就是说这些保存下来的画面可以比较完整的包含整部电影的剧情,不会遗漏某些重要剧情。 这个似乎要对电影本身进行研究,具体方向还没有想好。 这个计划的原因是对某些没有收藏价值的但不想删掉的rmvb格式电影的留恋,用图片格式保存一下吧,再转成djvu,几乎不占硬盘空间。
2 编写软件,自动模糊搜索互联网上固定类型资源,目前设定的是PDF文件。并自动根据文件大小,本身网页的介绍,以及编写者输入的书籍列表作为关键词进行下载,并将文件下载到本地服务器里。这个计划原因是自己很喜欢读书,或者说收藏书,有个类似人工智能的程序帮忙就节约很多时间,不过这个很难,估计还得拾起黑客的手段,总之很困难。
3 想到再update
4 Update: 呃 最近很不明白 为什么PDF格式的密码这么容易去除 而RAR文件进行加密后尤其是连文件名也加密的那种却根本没有被破解的可能? 两者都用了什么编码格式
5 还有mp3 avi ape之类的编码我想研究一下
6 Update in 08 27 2009: 呃 我准备读完Medalink提供的文献传递服务中的所有科幻小说 目前在读Echo 与12 monkey是同一个作者
7 我不明白PDF解码的机制 还有PDG之类的文件 为什么利用设计好的软件就可以读取相应文件 必定是解码问题 那么为何没有一个人设计n种格式通吃的软件呢? 例如对于阅读来说,某个软件可以识别并编辑TXT,PDF,PDG, 想必这个软件一定会火
8 如果所有格式通吃很难的话,那么仅仅对其小范围预览怎么样 Foxit Libary是不到1M的独立软件,可以迅速搜索并预览硬盘中PDF格式文件的封面,那么设计一个软件可以搜索硬盘并识别PDF,PDG以及DJVU格式,并且对文件的第一页进行预览,形成类似图书管理器的软件
9 Update in 08 28 2009: RAR是很棒的压缩工具 研究下压缩算法 对于某些格式例如PDF貌似压缩的很少,有的甚至文件会变大
10 Adobe Acrobat 8 没有打开rar以及zip格式的功能 应该比较好实现 只要打开rar然后将其中的PDF文件缓存处理,然后即可读取 这样可以方便的管理图书,尤其那些打包存放的PDF图书
11 嗯 我读过《彩虹尽头》 记得有一段对于书的数字化 巨大的机器吞噬读书馆一排排的图书,上万个微型扫描仪对所有的打碎的制片进行扫描,在智能的软件下进行书籍的数字化恢复。我想那一天总要到来,Amazon不是推出了Kindle了吗? 9.99$一本数字图书。图书数字化早晚的事。但关键是,我想在想的是:全文检索毕竟不可能有那么多人进行书目的编排,而那些书只要在那里就行了,然后有一种引擎进行快速的智能的深度检索。大型企业管理员类似,建立索引,然后检索。那么,什么样的软件,什么样的功能,什么样的算法比较好?