新闻中心

素图科技荣获“2019XdHacks SH创客马拉松大赛”亚军

综述:

2019年10月,素图科技创始人崔璨和梁爽在“2019 XdHacks SH创客马拉松大赛”上,以一款“智能视频摘要系统”斩获亚军。该系统即为素图科技自研产品【剪刀兔——视频自动转图/文/GIF媒体编辑器】的前身。

互联网时代,各个平台的媒介形式不一,如何快速实现”同一内容多平台发布?“本团队开发的智能视频摘要系统,通过人工智能技术,提取关键帧信息,可将一个视频文件快速且实时转换成图片、文字、短视频和动图等文件,以适应不同媒体平台的发布需要,提升媒体人员工作效率和质量。

以下为官方获奖报道。

1.jpg

采访:XdHacks SH 组委会

受访者:素图科技创始人 崔璨

项目的初步设想是如何产生的呢?

我们团队其实是一个区块链底层技术开发团队,同时也在做区块链研究资料的收集整理工作,需要看很多技术视频。开发小哥嫌看视频太长太麻烦,于是他就提出来,想做一个视频转图文的工具,实现快速阅读和资料归集。而我之前是做新媒体的,听到他这个想法后,我就惊呼:“你知道,假如一个视频可以快速自动转换成图/文/小视频/动图,这能拯救多少新媒体编辑吗!” 于是一番商讨之下,“智能视频摘要系统”的理念就诞生了。

产品的商业模式、使用技术和解决的现实问题?

一个是互联网教育行业。你可能是一个网课的运营者,但你自己都不能很好的归集整理你的网课内容,这时可以通过我们的系统,把45分钟的视频课程变成一篇带时间轴的图文课件,这样方便你自主整理和查询;而对于学习者来说,视频转成图文课件,学习效率也会大大提升,智能视频摘要系统很可能就会成为网课平台差异化竞争的小工具。

另一个是媒体行业。新媒体运营人员估计都深有体会:某个活动发布会要报道,既要有视频直播,又要做图文直播,可能还要发微博,发微信,发抖音,等等,每个应用要求的媒体类型和格式都不一样,怎么办?要是往常,可能是一个编辑一边直播,一边守着截屏,打字,截小视频,截动图……但用了智能视频摘要系统,我们就只需要一个视频源,通过人工智能图像解析和语音识别,就会自动生成出图片、文字、小视频、动图,而且支持修订,编辑只需要挑选自己要发的内容,就可以一键复制发布到各个平台上去了,大大节省了编辑的工作量。这个工具对于vlogger们也特别有用,一个视频内容可以快速转成不同形式传到不同平台,省时省力省心,又能扩大流量。所以我们团队的自媒体已经把它用起来了,真的非常方便。

比赛现场有什么印象深刻的事情吗?

项目想法其实是比赛前两天才冒出来的。赛前一天整理东西的时候,突然想到:既然我们要做这个,不如就把比赛开幕式的视频录下来,作为我们即将开发的系统的一个测试文件?

于是当天我们就扛着三脚架和相机过去了,还特意早早到达占了第一排有利位置,事实上这段视频转换效果也非常成功,台上老师们讲的PPT都被完美的截出来了。

这次比赛很高兴能跟各位老师有所交流,认识了不少新朋友,超开心。

2.jpg

为什么会想参加这次的XdHacks创客马拉松上海站?

其实也是跟我组队的队友邀请我一起来参加的,我们平时也比较关注这方面的一些内容。如果有时间的的话我们都还是乐意去参加一些黑客马拉松的比赛,因为觉得可以认识很多人,也可以接触一些新朋友,然后了解一下大家都在做些什么,所以最后就报名了。

来到比赛现场之前的项目构想

我们最开始就了解到这个是人工智能主题的时候也没想好明确的方向因为其实我们这个团队主要是做区块链的,然后快要到比赛前几天的时候,正好我们开发有一个需求,因为我们在做区块链的这些资料的一个收集整理,这其中就涉及到我们要看很多的视频,比如说像以太坊他们每周都会出一些这种会议啊之类的视频嘛,我们都要看。

看视频发现特别花时间,一个视频很可能一两个小时,哪怕是加速看都很花时间,于是开发他就跟我说他特别想要做一个工具,就是把视频转化成图文的这种模式,就把视频里面的重点的一些图片,包括有一些这种课程视频啊,它里面是ppt的,就把每一个ppt都自动解下来,讲的内容全部都转成文字,这样我们就不需要花一个多小时去看视频了,我们就可以很快地把视频变成图文以后很快地看完。

然后他提出了这个想法,我说我觉得这个想法特别好,因为我是做媒体的嘛,我说,我做媒体的时候也经常会有这种需求,就是,比如说做媒体直播的时候,你可能,一方面你是做视频直播,但另外一方面你也要做图文直播,那以前的话可能是一个小编就守在电脑面前,看着这边一边在直播一边在不断的截屏啊打字啊,特别麻烦,特别累。我说你要是有这个工具的话那我们媒体编辑岂不是要轻松很多了。

于是我们后来就探讨了一下,觉得这个思路挺好的,也蛮适合人工智能这个主题,于是我们就设计了这个视频转图文、动图、小视频的这么的一个工具,是出于我们自己本身有这方面的一个需要,所以说我们就做了这么一个东西。

在比赛的32小时里做了什么,和搭档的分工?

我搭档主要是做开发的,他是技术人员。而我主要是负责产品设计这一块,就是关于这个产品最终要做成什么样子,其实主要是我来决定的,因为最开始他想的其实是希望自己看一些教学视频的时候方便一点。

但是到我这边,作为一个媒体人员我想把它作为媒体编辑的一个使用工具,于是这两种设计路线就变得不一样,就所以说在这个设计中间的话我就提了一些需求,一些编辑们才会有的需求,而不是一个观众才会有的需求,编辑们有的需求比如,我希望这个视频转成图文了以后,这个图和文字我还可以再编辑因为有可能识别不准,有可能哪怕识别的非常准确,我认为视频里面的这个文字都不适合发到新闻稿里面去,那我需要对这个文字进行再编辑,然后我就提了一些设计的需求,然后最终把这个产品给完善出来,而他是主要是做了这个技术开发这一块。

有没有遇到的瓶颈和阻碍?

其实也还算好,因为不得不说我的队友能力特别强,开发能力特别强,他一个人就搞定了所有的事情,而我主要是除了提需求以外就是在负责做那个产品的ppt以及最终演讲的的时候要怎么讲,倒是没有遇上什么特别难的事。

如果真要说的话,就是有一个小遗憾,就是我们这一次没有找一个前端人员跟着我们来做这个事情,所以说整个最后呈现出来的图形界面呢比较朴素,就不是那种看上去比较炫酷的那种效果,整个是一个非常简洁的编辑框,因为我们也没有人手来做这个事情了,我们应该是唯一一个两人组队的队伍了。

比赛结束之后对项目的后续思考

其实这个项目会受欢迎这个事情我们还有点出乎意料,因为我们之前一直在做区块链开发,人工智能这一块对我们开发小哥来说完全是顺手在做的一个事情。不过他以前是在做图像识别,他之前在图像识别发了四篇论文,然后也做过很多一些相应的工作。

我们最近重点是在区块链上面,但因为这一次比赛,我们也突然觉得,这个东西其实蛮好,因为实用性的工具是非常有市场的,连我们自己都觉得这个工具很好用。跟我们有一样需求的人,他们也会需要这个工具。所以在经过这次的比赛以后,我们就决定把这个工具市场化了,就是把它包装成一个真正可以让别人来很轻松地购买使用的一个产品。

而且在现场评委也给了很多鼓励,甚至有些评委说如果做出来的话,他们也很愿意很乐意来下单,来购买这个产品,这个也是提升服务的。