好工具 | pdf电子书剪裁briss

相比epub和azw3等格式,pdf电子书的排版和页码都与纸质相符,适合做笔记和引用。特别是理工科的电子书,公式和图示与正文一样重要,排版不变型非常必要。不过,pdf电子书也有缺点,比如排版与纸质品相同,所以每页上下左右都有相当大的白边/页边距。如果不是用PC机大显示器,而是用ipad读,那么就正文太小、页边距太大了。

有个工具briss https://sourceforge.net/projects/briss/,可以剪掉白边。

操作很简单,而且是可视的,随时预览效果。

运行briss以后,菜单左上角 File | Load File。

读入文件以后效果是这样的。左边是奇数页,右边是偶数页。

读入的PDF文件是亿万星辰先生的著作《D&D演义》,排版仿照了三宝书,在PC机上读起来非常古典,印刷出来也应该很精美。

但是,当不太注重阅读体验的时候,比如在 ipad mini 上,会希望把红框(我加的)以外的部分切掉。

Briss就是为了解决这个问题而设计的。

在上图中,(1)白边表示由briss识别建议切除的部分,(2)微蓝色的部分是PDF页芯/版芯处理成半透明,供操作时参考。左上角和右下角两个柄可以拉动,改变剪切crop 的范围。

如下图所示,我把页芯的范围放大了一些,把左下角的页码包括在内。并且展示了这是偶数页的部分。

如果切掉大部分下半页的图,是这样的。

半透明(alpha通道?)展示,大大方便预览 绝大多数页面 的效果。

对效果满意以后,菜单 Action | Crop PDF,就剪切了,得到新的pdf文件。

我刚刚设置的剪贴范围,效果是这样的,果然丑了很多。原本的细节精致和经典,都没了。

也有些pdf文件,去除页边距以后,页芯大了不少,文字也能因此更容易阅读,效果没有变丑太多,可以忍受吧。

Briss是基于java开发的,可以跨操作系统;发布时已经编译为exe,不必了解JVM。我一直用的版本是0.9,大小9M。虽然并不常用,但是每次装机器都带着。偶尔用到的时候,真方便而且给力啊。不需要的时候它并不会像有些工具那样跳出来大喊“我又干活了”。这类好工具的最大缺点,恐怕是你会忘掉它的存在吧。

 

渔之乐,纯回忆,并非讨论鱼与渔

前几天高烧刚退,体力不足,头脑也还是非常不清楚的状态,稍微有点深度的书都看不进去。微信公众号推荐给我的视频里,有赶海的,一会儿看一个,刷了一整天。

就是那种海边有个几十米的大石坑,用泵排水,见底以后上手摸鱼。有鳗,差点咬到手的,扔到一边,再慢慢捋着装进桶里。有龙虾,螃蟹。有各种石斑鱼,也许叫这种名字吧。名目很多,我不认识这些分类,只知道全是鱼,看视频里的人大呼小叫摸得高兴,我也嘿嘿乐一会儿。阳光,海水,礁岩,久违了的室外风光。看别人乐呵,觉得自己也挺幸福的。

突然,电光闪耀一般,我就想起了小时候。原来,我也摸过鱼,还挺喜欢。

小时候家住的地方叫南山,山上是松林和一层层山,听说过有人走进去没出来的。山下是浑江,浑江堤坝和江水之间,常年有大水泡子。我们最长去的水泡子二三十米见方,沿江的方向比垂直于江的方向长一些,水非常浑,一点也看不到底。附近还有几个更大的,也更危险,我们一般不去。现在想,也许可能是挖沙留下的,也许是讯期江水冲击出来的。

夏天的时候,泡子里有很多像我那么大的小孩。大的不过小学高年级,多数应该还没有上学。有钓鱼的,有捞鱼的。也有游泳的,我们称为洗澡,虽然不在江里而是在泡子里,但是叫做去大江洗澡。晚上的时候回家,身上一层白印,挨揍是免不了的。还被父母在大桥上看到过,喊回家揍。

没有任何急救设施,什么救生圈之类的全没有。塘底全是淤泥,可能还有水草。年龄差不多的一个小伙伴,有一位就在里面淹死了。他兄弟二人,都是聋哑人。听说哥哥那天帮邻居家大娘拎东西上山,就那十几二十分钟时间,弟弟一个猛子扎到水里面了。大家说水面直冒泡,没有人敢下去救。有人说如果他哥哥也在,弟弟可能就得救了。也有人说如果那天哥哥在,哥俩就全交待在里面了。

尽管出了事故,也没有阻拦住任何一个小伙伴再去泡子。也许附近的家长狠揍过孩子们一段时间,也许后来就没有人去了。我记不清了。很多年以后我从大桥上远望泡子,还想过,就是那里啊,形状有点变了。不过水浑黄的,还有土岸崩塌的边缘,也还是那样。一脚踏进去,可能是夏日清凉,也可能就是永诀。

从这个泡子沿江向北,是一大片江滩,有很多大小泡子,串连起来,彼此隐约相通。泡子之间长满各种草和大小卵石。

这些泡子里有很多鱼,我哥带我去钓鱼捞鱼来着。我哥的手很巧,做出的渔具比买的还精致。他折叠牙膏皮做的铅坠,比市场上那种黑乎乎的黑球漂亮多了。扔到水里的时候,像暗器样在水面上一闪,刷地就没进去了。鱼线有时是买的,半透明的,有时是家里的蜡线,能把我手指勒得快出血了也扯不断。还有鱼钩,买的那种是有倒刺的,得从侧面才能捏着,胆战心惊。也用缝衣针放在火上烤,再弯过来。不过,没有这么大的鱼,我爸说这纯粹是糟践东西。鱼饵,从来没见过面食的,后来听说还可以用面炒,非常惊讶。就是从河泥湿的地方,有时柳树下,挖蚯蚓。很粗一条,抻得又细又长,装在小瓶子里。到要用的时候,把蚯蚓串在鱼钩,甩进水里,小心别钩到自己。

正经地,我一条鱼也没有钓到过。大学的暑假,有高中同学带了特别专业的钓竿,我们在校园里的静湖里试过,忘了是谁,似乎是我,钩在鱼肚子上带上来一条。旁边一个哥们用半米长的条帚mi子,抻着胳膊才把鱼线扔到水里,一会儿一条,一会儿一条。这些都是后话了,不过我从小就没有钓到过鱼,一直到这时候才第一条。小时候跟我哥去钓鱼那么多次,鞍前马后的,心智盎然,居然一条也没有钓到么。

我哥还带我去捞过鱼。用纱窗,可能还有纱布,两边用棍子固定。撑起来,大的鱼网一边一个人,边霍搂(搅拌)边探着底往前走。小的鱼网一个人负责,一只手撑一边,也是边抖擞边前进,河底的泥全翻上来,像乌云一样,水里什么也看不到。低头猛冲一阵,抬网,有时里面就有鱼翻着白肚跳。课文里怎么说来着,高兴地直跳,就像高梁笑红了脸,谷子笑弯了腰,都争先恐后地等着被我们抓。

说得这么热闹,用这个方法,我只抓到过一条鱼。我哥和小三儿两人是大孩子,䠀着水这儿一下那儿一下,我只有资格在岸边看。有时候荣幸,可以在他们对面负责赶鱼,按指挥的路径,“这边是沙子底”,更多时候傻站在那儿看他们越跑越远,绕到长草后面,拐进另一个泡子里了。我有一次把一面小网铺开,上面压了一块石头。过了一会儿起网,居然网到一条小鱼。唯一的一次。

应该就是这么个场景:特别热,我浑身都是花纹,光着脑袋晒在阳光里。手里捏着唯一的鱼获,我哥和小三儿已经不知转到哪里去了,没有谁分享我的喜悦。

那一次,我们清零了整个那片浅水区域,后来很久都没有鱼。我们抬了两三桶大大小小的鱼,泥鳅居多,用《英雄救日月》小人书里的大大小小的蛇命名,龙王龙母龙家的几太子这一类的。最大的一条是鲤鱼,一臂长,因为不是泥鳅,所以没有名字。

回家以后当然要挨揍,捞鱼有生命危险,必须揍了以免下次胆子大。揍得有多狠,印象已经不深了,肯定不是最狠的一次。隐约记得家长对渔获分配也有不满,但是这些也不是我所能关心的。我不会刷鱼刺,那个时候就不会。

后来想想,我不仅对收获分配没什么兴趣,连对精益求精提高技艺,也只是偶然喜欢。不仅对钓鱼捞鱼,也包括对计算机、写作、专业学习,各项技能的训练,更多的时候,还是因为训练本身带给我快乐,而不是为了追求训练的结果。想想为了未来而严肃地努力,我整个人都严肃了,也就不那么好玩了。

这么多年来,想起那些夏日的午后,跑前跑后,忙着些看不懂搞不清楚的东西,跟着把渔线鱼网装起来扎起来。远远看着我哥和大孩子踏着浊浪威风凛凛,张网抓到那么大的鱼。我要做的,不过就是在泡子边站住了,别掉到水里。极其偶尔,自己居然也能抓到一条,简直超出预料的快乐。

世界庞大而空旷,阳光刺眼。我一直傻站在那里,是个满身花纹目光迷茫的小孩儿。

格拉肖之蛇-溯源之旅

格拉肖之蛇-溯源之旅

故事要从2022年6月18日讲起。与六一八购物没什么关系,从这个意义上说,就是随便的一天。不过,由于有具体的日期,以后需要回顾更多细节的时候更容易追溯其他细节。

1. 汉英互译

最初,师兄陈昕若问我,“1986年的某一期纽约时报,有什么办法找到?”

我说,“告诉我哪一期,想找哪篇文章。”

陈昕若语音,“你听说过欧若波若斯蛇么?”

我说,“我就听说过法老蛇。”

我一下子想起法老蛇,是因为师兄的职业是高中物理教师,有精彩的网课,还经常做有意思的演示实验。一千根雪糕棍编织的蓄能长带,点火触发以后像蛇一下昂首在空中舞蹈,满教室学生欢呼。冷气四溢,低温超导体悬浮。跟我讨论乒乓球在空中悬浮时伯奴利力和什么力来着哪个占的比例高。所以,这么奇怪个名字,什么蛇,我一下子就想起化学实验那个法老之蛇,马上想提醒他那个挺危险的,有毒。

同时,我搜索,猜测着把欧若波若斯这个发音输到 bing 里,输入开头,后面的提示就来了。有时候,搜索的时候 bing 会给出发音或接写接近的建议。经常是对的。尽管有新华社音译要求,源头是英文的资源,在转译为汉语时,包括术语在内,但是现实情况是经常有多种不同翻译,音译更是不统一。所以,我找资料的时候会尽快确定英文原文是什么。

搜到了这个,Ouroboros。

C:\Users\young\AppData\Local\Temp\WeChat Files\91e8544178f2a1cd0f5766eeb561d92.png

2. 这个我认识

这个图我认识,龙神。形象是一只咬住自己尾巴的大蛇。如果搜索资料是个游戏,这算是作弊吧——我刚好知道答案。在技术讨论中却只能作为线索,而不能作为证据。总不能拍胸脯,别人就信你吧。

龙神,在科幻界非常有名。海因莱茵有著名作品《你们这些还魂尸/All You Zombies》,又译名《龙神》,就描写了这样的意向。当年科幻世界笔会的时候,某位作家给我们复述这个故事。我还记得他讲到,“这位女子长得非常难看。”有人打断他,“讲重点”。他说,这点非常重要。后面是个盘肢错节,循环往复的故事。给出的象征意向,就是吞吃自己尾巴的龙神。只是我忘了Ouroboros这个名字。

我给了陈昕若上面的截图,以及以下信息。

[https://www.britannica.com/topic/Ouroboros]

他给了我具体诉求,以及上下文。

我整理一下,要找的是符合下面要求的文章:

作者:著名的美国物理学家、诺贝尔奖得主 格拉肖

时间:1982 年 9 月 26日

期刊/报纸:《纽约时报》

篇名:未名

内容与物理学有关,可能涉及粒子物理和宇宙学。

重要线索:咬住自己尾巴的蛇。

3. 作者,报纸,墙

格拉肖,Glashow。诺贝尔奖得主这种级别的物理学家,名字容易找到。

纽约时报,这种级别的报纸,找特定日期的,也容易找到。

但是在目录里,这一天没有找到这一作者的文章。

我访问不到这个页面。

线索分成了两条,一条是作者,一条是报纸。

报纸这条线索不顺利。报纸的更多细节,我访问不到。后来new york times 找到了2015年合订本,没找到其他年份的。[https://www.nypl.org/research/collections/articles-databases/new-york-times-1980-present]

这个需要借书卡。

C:\Users\young\AppData\Local\Temp\WeChat Files\b8da6a35ff2f17fc07c0b56752a90c8.png 此外,网速特别特别慢,并且经常超时。我们找到了那天的报纸,看着一点也不像有大蛇的样子。以下是部分截图。

C:\Users\young\AppData\Local\Temp\WeChat Files\976a0d2c90294d637c91cfec8e728d0.jpg

作者这条线索,格拉肖确实提到过这种蛇。

[https://www.mediatheque.lindau-nobel.org/laureates/glashow]

C:\Users\young\AppData\Local\Temp\WeChat Files\50215d34f86d6cc10a8c36e0a9e0f8f.png

上面这张照片的左边,就是大蛇的一部分。

在他的书里,也提到过大蛇。Interactions - A Journey through the Mind of a Particle Physicist and the Matter of This World (Sheldon Lee Glashow, Ben Bova) ,1988年出版。

纽约时报书评提到过的,也许就是这本书。

[https://www.physics.harvard.edu/people/facpages/glashow]

格拉肖本人还在世,90岁,这里有邮箱。写邮件去问,也是一条分线索。

此时我开始怀疑,也许并没有那么一篇文章存在,作者是格拉肖,发表在那个报纸的那一天。

4. 到底要找啥

我问陈昕若,你那段中文,从哪里截的?原著是英文么?说不定翻译错了,如果是英文我去查下原文。

是这个。

陈昕若还找到格拉肖的另一本书里也有大蛇。

C:\Users\young\AppData\Local\Temp\WeChat Files\b14bd8306410ee40b855e28ac7f9c88.jpg C:\Users\young\AppData\Local\Temp\WeChat Files\ad25d25d6096deb5504d989f4e5562c.jpg

然而这并不能说明那份报纸那一天有这么一条大蛇。为啥非要找那张报纸呢?那是最早?还是就为了和那本中文书那句话对应上?

因为强迫症吧。这是不少中文科普资料也带给我的困惑,那就是,这个观点、这张图,是不是作者瞎编的,到底从哪来的,什么时候开始有这种说法的。这种说法是不是符合客观事实,这是另一个问题了。我长期困惑包括,历史书上的但丁为什么长得像个女人,伽利略和哥白尼怎么长得挺像的。溯源找到更清晰版本以后,困惑根本就不存在,问题在于印刷质量。

那么,这条大蛇用来像素物理法则到底何时出现的,谁画的,与纽约什么报纸有什么关系。

5. 文章,出版物,作者

我知道 New York Times中的 Times有翻译为时代广场的,还有说与泰晤士报(不是泰晤士河)有关的。但是没有想到 New York Times 和 New York Times Magazine 的区别会让检索麻烦这么多。

在跟踪作者格拉肖这条线索的过程中,终于报纸的线索也露头了。

有篇文章非常讲究地给出了参考文献。

http://ircamera.as.arizona.edu/Astr2016/images/extcosmo.htm

8. Sheldon Glashow, sketch reproduced in T. Ferris, New York Times Magazine, Sept. 26, 1982, p. 38.

所以,这份媒体根本不是《纽约时报/New York Times》,而是 New York Times Magazine。

C:\Users\young\AppData\Local\Temp\WeChat Files\40315cfe74ad73fa7235fcd5b51aabc.png

以上是免费即可看到的目录,红圈里,就是那条大蛇。

C:\Users\young\AppData\Local\Temp\WeChat Files\8a779199c742e24221ededc144e1429.png

作者也并非格拉肖,而是Tim Ferris。

“Sheldon Glashow sketch reproduced in T. Ferris N. New York Times Magazine, Sept. 26,1982: 38.” 那么,是glashow手绘,在这篇文章里发布的。

所有大蛇,可能最初的源头是这里,后来分化出很多细节,然而源头考证起来就麻烦了。

比如照片切一部分作为书的封皮。

还考虑过联系下面这位,问老先生的资源出处何来。没机会了,老先生去世了。

刘则渊(大连理工大学科学学与科技管理研究所暨WISE实验室),“他格外热心中学生的科学教育,1982年手工绘制了一幅呑食自己尾巴的巨蛇草图(图1),生动形象地描述了科学世界与大统一理论。”[https://blog.sciencenet.cn/blog-1557-661949.html]

C:\Users\young\AppData\Local\Temp\WeChat Files\bc9edf8952259a3531ce74495b85558.png

这个版本的风格非常接近手绘,像是原始出处。下图是对比。

C:\Users\young\AppData\Local\Temp\WeChat Files\71dca0e4cf0ba7beb89ad6dd2ce9780.png

陈昕若提供的,高中教材里的。明显重绘过,取其意,而失去了手绘风格。

C:\Users\young\AppData\Local\Temp\WeChat Files\bb54dfa89f5a9a01550af2cddde9f9e.png

教材里。

C:\Users\young\AppData\Local\Temp\WeChat Files\8a2cbab74b67c41266c88eaeb5d09b9.jpg

但是出处,就像此前我提到的,“我刚好知道”,没法作为依据。

我和陈昕若聊起来关于证据:我信又如何,难道也教给学生“我就是这么学的”,那样的话还要旁证干什么。他也赞同,所以希望清晰的图片,当然还要出处。

我引证 微信公众号 “我查查看”,还有

https://mp.weixin.qq.com/s/noeHEUMN-MkGMzTqLk9xqw

10年了,终于有人发现中文维基百科的俄罗斯历史是胡编的了。

陈昕若一本本给我看物理书,都有这条大蛇。

6. 原文

故事的最高潮不是由我们完成的,而是由图书馆的老师出手。当知道了文章名、作者、期刊以后,找原文是个专业工作,非我们所能为也。得到两个版本,一个有全文文字版,另一个配了图片。感谢图书馆的同事,牛!

原文的封皮即极有震撼感,电场中的基本粒子轨迹。

大蛇在此。

后面是对撞机一类大型设备的仰视图,雄伟壮观。

故事的尾声是这样的。

我说,得写参考文献,不是用来显摆真有这么本书很牛,而是用以表明观点不是自己的,其来有自,参考文献就是说明其来源的。以供读者核对和溯源。

陈昕若说,“咱俩整理一下检索的过程吧,你写个博客,我做个视频。期限就约在年底。”

 

一行脚本 不断自动恢复下载

1. 问题

你遇到过这样的情况么?用浏览器下载文件,网速不给力,或者你知道在从服务器到你的座机间网络的某个节点有个什么限制了下载速度,然而你无能为力。所以同一个文件在学校可能只需要15秒下载完毕,在家里就需要15分钟,而且时间不稳定,还可能慢慢变长。

可能突然就会这样,超时了。右边的叉(取消)变成了带箭头的圈(重试/恢复),你及时点击它,可以续传。

如果你一眼没照顾到,过一会儿就彻底超时了,只能重新下载。

如果只需要几分钟还可以忍受,但是往往涨成几十分钟,把你绑在椅子上,又不能安心去做别的。

为什么没有这样的工具呢?(也许有吧)我怀疑是因为在这个世界上并非处处都有你我遇到的这一困难,别人的网速没准特别快,根本不需要手动续传,甚至不会触发超时。

面临这个问题时,我通常在心里诅咒,然而于事无补。后来我终于忍无可忍写了一行脚本,替我看着下载进度,一旦需要恢复/重试,就去自动点击一下。

2. 使用方法(在Firefox下测试通过)

使用方法很简单,不需要会编程序。之所以没有做得界面更友好,是因为我懒,所以需要按以下步骤操作。

第一步 开始下载你的目标文件。

第二步 在地址栏中输入 about:downloads,回车。

Ctrl-J 并非总能符合下一步的要求。

第三步 F12,得到 console。

第四步 在 console 中输入以下这行代码,回车

setInterval(function myTimer(){$("[data-l10n-id='downloads-cmd-retry']").click()},1000)

这就是唯一可以算作我工作的部分,一会儿解释原理。

得到如下效果,其中的82可能是其他数字,不必关心。

效果是,从现在开始,所有正在下载的文件,如果出现 恢复/重试 按钮,会在1秒钟内自动被点击。我保持开着这个页面,切到后台,时不时过来瞅一眼,看进度还在,再放心切回去干别的活儿。这个页面关掉,也会不断在1秒内重试,直到关闭浏览器。

3. 原理

原理是,about:downloads 这个页面也是HTML/CSS/JS的,所以可以在 console 中在线修改。

点击inspector (这并不是它的名字,那个按钮的名字叫做 Pick an element from the page),

然后点击带箭头的圆圈,得到按钮的HTML代码。

既然能手动找到按钮,(1)我们可以用代码

 $("[data-l10n-id='downloads-cmd-retry']") 

找到这个按钮。

(2)找到按钮以后,我们用

$("[data-l10n-id='downloads-cmd-retry']").click()

点击它。

(3)触发动作的时机,我偷懒,并未(轮询或中断/回调)检测 恢复/重试 出现,而是每1秒钟尝试点击一次。

setInterval(function myTimer(){$("[data-l10n-id='downloads-cmd-retry']").click()},1000)

即使按钮并不是 恢复/重试 状态,此处也不会报错。

如果有多个恢复/重试按钮,这段代码会逐一点击。

4. 未尽事宜/后续工作

我本想写成 tampermokey 脚本,这样大家(以及我)用起来更方便一些。但是我遇到了困难。tampermonkey 脚本应该匹配特定站点,只在特定站点或地址执行。我不知道如何把 about:downloads写入 // @match 这一行。

如果有多个恢复/重试按钮,这段代码会逐一点击。这并不是我原始的态度,不够优雅。我本打算 想设置哪个文件为不断重试,就只重试它自己。然而,我在 console 中不会指定特定的某个按钮。试过用下标区分匹配的按钮,即类似 $("[data-l10n-id='downloads-cmd-retry']")[0] 这样的写法,实验表明需要在 tampermonkey中

// @require http://code.jquery.com/jquery-latest.js

才能支持下标语法。或者会触犯 firefox 或 chrome 的安全规则?总之我没成功。

在 Chrome 的 console 下我不知道如何(在不触犯安全规则未能导入jquery)使用 $("focus-type='retry']")

找到 恢复/重试 按钮。所以向 Chrome 移植失败。

哪位大侠知道如何改进,还请不吝指导,我尝试成功以后补进以后的博客中。在这之前,对付着用吧。