在这里插入图片描述

上一篇我分享了我自己通过n8n实现的AI资讯热点捕捉器。那么在实际运行了一个多月的过程中,我发现了一些小问题。我是如何解决的,本篇就是对此的一个补充篇。

在这里插入图片描述

上图就是目前最新的形态。主要的变化在YouTube部分的信息处理。同时将一些重复的部分做了精简。

工作流优化

提取字幕

原始的YouTube RSS信息里面只有标题,没有内容信息。所以实际使用中,如果只看标题有时并不能完全知道在说什么。
在这里插入图片描述

一天六十多条消息,其中几条视频,我不可能都点开看看。所以就需要知道视频在说内容,那么首先就想到了获取视频字幕,然后让AI通过字幕,帮我总结内容。

这里推荐使用Apify,每个月有免费5美元的额度。

在这里插入图片描述
我使用的YouTube Scraper是按次数收费,一条视频获取字幕调用两次工具合计0.01美元。我一天就4条左右的视频,一个月完全够用。

在这里插入图片描述
具体如何获取API tokens我就不说了,大家都会。Apify节点配置如下:
在这里插入图片描述

可以看到结果中返回了srt的信息。然后就是加了一个code节点,将字幕内容中的文字提取出来,最终效果如下:

在这里插入图片描述
如果你担心有些视频太长,文字内容太多。可以在code节点做限制,比如最多300个单词,或者获取前三分钟的内容。一般来说,视频的开头作者会说视频的主题信息,所以用于总结够用了。这个就具体看个人的需求了。

时间过滤

这个是一个很小的问题,也是偶然间发现的。因为目前我是每天早八点定时获取内容,在实际执行到过滤24小时内信息的节点时,可能实际都8点1分左右,在刚好有八点整更新的内容时,就刚好过滤掉了…

在这里插入图片描述
所以我就筛选时,时间不卡的太严格。在之前的24小时上加上几分钟,加点容错。当然你也可以换个定时时间,规避掉这种特殊情况。相比获取内容重复来说,内容没有正常筛选出来这个问题更严重。

部署n8n

可能大多数人都有部署n8n的需求,这里给大家推荐一个。ClawCloud 平台为注册时间超过180 天Github 用户提供每月 5 美元的永久免费额度,目前n8n在ClawCloud上每天0.14美元,算下来每月4.2美元,刚好够用。而我实际用下来,扣费远远低于这个价格。

虽然配置不高,但是大多数情况都是够用的。

具体操作大家可以参考:使用 ClawCloud 部署 n8n 并实现工作流自动备份,我就不赘述了。

上一篇我提到时区的问题,也可以在这里配置,包括你想使用的n8n版本。

在这里插入图片描述


后面再根据实际使用不断迭代优化,目前计划将每日资讯再做成播客,这样直接听岂不是更方便。怎么懒怎么来,哈哈~

最近还做了一个抓取市场差评的工作流,主要是Apple StoreGooglePlayTrustpilot三个平台,实现方法基本和资讯的思路一致,不过更多是根据具体平台做对应处理,比如Apple Store用的RSS,Trustpilot用的HTML提取内容。

最后将各个平台的处理做成子工作流,其他工作流调用,方便获取多个项目多个平台的数据。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐