【万字长文】畅谈3D高斯泼溅技术在移动端的创新应用与未来展望

科技视觉大放送 2024-11-07 08:09:13
最近和3DGS行业的创业公司CEO 康总进行了交流。康总对行业有深入的洞察和研究,从技术和产品、客户等角度出发来分析问题给了我很大的启发。 康总也是知识星球「 小六的机器人AI圈」嘉宾,欢迎在文末领券进入交流,查看更多的大咖采访。 采访大纲聊聊您的成长轨迹与专业背景如何看待元宇宙概念以及NeRF技术出现给行业带来的变化贵公司目前主要项目与三维视觉是如何融合的用户参与内容创作普及地球三维重建计划未来展望与规划如何看待目前商业前景以及有哪些潜在收入AR/VR技术落地与跨平台应用8.您认为目前三维技术面临的主要挑战是什么? 嘉宾简介康迂松 上海搜搭科技有限公司创始人,计算机图形渲染引擎创业研发企业经历,城市安全产业创业经历,行业背景涉及游戏、动漫、影视、ARVRMR、智慧城市、数字孪生、 仿真、文旅、地产等,对计算机图形技术在工业界的应用有丰富的项目经验和深刻的产业洞察。目前公司主要在人工智能领域从事三维重建和实时渲染前沿技术的研发和产品开发,主推产品3D Moment App(3D朋友圈App) 采访内容1. 聊聊您的成长轨迹与专业背景康迂松: 我早先是在一家计算机图形渲染引擎公司,负责投融、商务、市场和项目管理。这家公司的研发,瞄准的是下一代图形渲染引擎,尤其是要面向AR眼镜、VR眼镜提供更高效、更大数据吞吐、可端云协同的空间计算和图形计算引擎。UE引擎(Unreal Engine)是在计算机出现的时候诞生的,是基于并适配计算机而搭建的,而unity抓住了移动设备的窗口,是基于移动端的适配诞生的。这两款引擎很好的抓住了各自的时代机遇并成长为全球有影响力的产品。现在我们站上了下一个时代的窗口,即3D内容和3D空间交互的时代,这个时代最具代表性的硬件是AR、VR、车机,虽然还可能出现有其它形态的交互设备,但这些都离不开3D空间的计算和图形的渲染,那么适配这个时代的引擎将是一个巨大的机会,我前老板想抓的就是这样的一个风口。我们可以看到,早先包括现在大多的AR VR硬件产品都是基于像中间件的模式,在原有老旧架构的系统上去做图形的渲染和交互,这里面其实存在一个很大的问题,就是它在算力、数据通量,和系统适配性上会存在很多问题。所以基于这样的一个痛点,我前老板就想到要去搭建一个底层的更好适配的引擎,实现端云边的高效渲染,这就是我之前在上家做的这个事情。引擎是非常底层、非常技术、非常庞大、非常高门槛、非常烧钱的工作,像现在全球非常有名的某个引擎,早期基本上就没有营收,全是在砸钱。但我们不一样,为了更好的引擎研发和市场适配,我们会去做一些定制化的项目,这里面就包括游戏、影视、动漫,包括地产、文旅、文博、直播、智慧城市、车机、AR等领域的项目。所以其实我在这家公司的时候,对计算机图形、计算机视觉技术以及这些技术在产业中的融合应用有了一个全局的视野、深刻的洞察、广泛的项目经验, 给我现在做的事情打下了坚实的基础,非常感谢我的前老板以及我在这家公司的经历。 2. 如何看待元宇宙概念以及NeRF技术出现给行业带来的变化2020年出现了NeRF,这个技术刚出来的时候我就关注到了,并且非常感兴趣。然后我去做了研究,发现它跟传统的图形工业流程是不一样的,而这种不一样,为大众C端去参与3D内容创作、分享、交互提供了一个很好的契机。所以我就想,我是不是可以从这个角度去突破,去做一些事情。因为正好前两年也是元宇宙特别火的这样的一个阶段。但是后来元宇宙概念,热度又降下来了。这里面有很大的一部分原因就是它采用的工业流程。它其实就是把传统图形工业流程,从游戏领域搬到非游戏领域,做的一些社交、购物、文博、博展、教育项目,做成所谓的元宇宙产品。我们看Meta做Horizon,他需要有一个专业的团队,花费一个很长的周期,投入高昂的资金制作出来,呈现出来给到用户,用户最终只是消费这个产品,没法参与创作。本质上以Horizon为代表的这些元宇宙产品其实仍然是游戏产品逻辑。另外一个就是,这样的元宇宙产品出来以后,其实面对两个人群,一是会游戏的专业用户,还有一部分是非游戏的用户。对于专业用户来说,他看不上这样的产品,就是我放着黑神话悟空这种三A大作我不去玩,我会去玩你这么low的一个所谓的元宇宙产品,所以这部分群体直接给pass掉了。另外,对于非游戏用户,他进到这个场景里面,他不知道怎么去玩,不知道怎么互动,学习和使用门槛很高,这些用户进来看到一个新鲜的事物,新鲜的一个产品,有了一个浅显的体验以后,很快就退出来了,这部分群体也被Pass掉了。所以不管专业用户还是非专业用户,他们都没有抓住。根本其实就是这些产品采取的还是传统图形工业流程的这样的一个技术路径。但经历这么一个来回,我们看到了年轻群体对区别于传统互联网应用的3D产品抱有极大的热情和期待。那NeRF出来以后,三维内容的创作可以跳出传统流程,就是说我一个普通小白用户,不需要去建模,不需要去搭建场景,不需要去雕刻角色,不需要懂什么材质纹理贴图展UV骨骼绑定动画K帧,也不用学怎么设置交互逻辑、调光照粒子、设置虚拟相机等等。我只需要一个摄像头,拍摄采集视频,然后上传就可以创作3D空间(或内容)并且可以交互。这个就很有意思了,所以我就觉得元宇宙这个事情应该是从C端低门槛趣味化强互动的创作分享去突破。你想,未来的元宇宙空间,它一定不是像Meta那样的某一家或者某几家大厂用传统图形工业流程就能够覆盖得住的这样的一个巨量的虚拟空间的创作。而借助C端的力量,可以低成本把我们现实世界的空间去映射到虚拟世界空间,并且在映射完了以后,你还可以去做更多的风格化和更多的交互和玩法。所以元宇宙我觉得应该是借助这样的一个形式才有可能实现,也就是有这样的一个契机,我开始做我现在的这个产品。然后神奇的是去年年底的时候3DGS出来了,它在重建和渲染的效率以及在存储等其它各方面的性能都有了大大的提升,而且这个方向一定还会有更大的更多的突破,某种意义上未来将极大变革传统图形工业流程,或者最终两者会双向奔赴,那我更坚定了能做成这样一个产品。大概就是这样的一个情况。 小六: 这里面我问一个问题,你刚才说C端这块是不是可以这么理解,你认为以后他是用消费级的相机也好,主要以相机去对空间做建模,而不是说我要用专业的设备去做,你觉得这个事情是未来的一个大方向,可以这么理解吗? 康迂松: 对的,未来肯定还会有一部分内容是基于专业的设备或者专业的团队基于传统的这个流程去搭建,就是我们现在游戏或者测绘领域的方式去搭建的这个虚拟资产、数字空间。这是专业级别的内容生产(PGC),属于B端或者专业用户,他们去做一些专业的深度的内容生产,未来这一部分还是会有。但未来最终还是要把生产力释放给C端,给C端去创作,你才有无穷多的内容。我认为未来C端只依赖手机摄像头以及通过3D生成大模型的3D内容创作才是主流。如果还要依赖手机以外的其它设备,就相当于给C端又设置了一道门槛,无法充分释放C端的生产力。 3.贵公司目前主要项目与三维视觉是如何融合的小六: 那就像你刚才讲的这一块,关于你做的项目,目前它是一个什么样的情况?就是行业里有没有人在做? 康迂松: 我们其实是一个初创的团队,也是在2022年出来后,我决定要去做这个事情的时候,我一点点拉起这个团队。我们做的这个产品,名称就叫3D Moment App(3D朋友圈App)。它不需要依托特定的硬件设备,只需要一部手机,提供一个应用给到用户,用户通过这个应用去调用手机的摄像头拍摄照片或者视频上传,我们把这个照片和视频中的空间去计算出来以后,推给用户发布成为一个三维朋友圈,这样的话在这个平台上的所有的用户都可以去跟其他用户的三维朋友圈去做交互,比如说进到这个空间去做穿越去做风格的变化,去做内容的增删,比如说在墙上挂画,或者说在桌上摆花放猫或者说其他的道具。也可以和游戏影视的角色IP去融合,进到这个空间里面,然后在里面去做交互。通过C端持续的内容累积,我们会有大量的流量,有丰富的3D数据,我们可以在背后把这些3D数据整合,也是我最终想做的事情,就是能够实现全民地球三维重建。简单来说,我们做的事情其实就是一个低门槛,有趣好玩的一个三维朋友圈这样的一个移动端应用程序,背后支撑的就是图形渲染和三维视觉技术。 小六: 我有个问题,第一个就比如说我跑到南京东路那边,我用自己的手机拍一个视频,然后我用你们的app生成一个3D的场景,那可能隔了一周你也去那边,然后你的天气你的各个环境都不一样,你也做了一个这样的事。这两个事情在你们的后台也会去做一个类似异源的3D数据的处理是吗? 康迂松: 会的,我们肯定会去做的,我们基于用户重建的3D南京东路,可以是不同天气条件的融合、可以是不同风格的融合。比如说,南京东路的前100米发的3D朋友圈是春天的,然后相邻的第二个百米空间是夏天的,第三个百米是秋天的,第四个百米可能是冬天的,它里面就有好玩的点在里面了,它本身就是有趣的,不一定我非得要去把它弄成一样的天气状况,同一个季节同一个时间点。你还可以做风格变化,比如说南京东路前100米,我给你提供一个赛博朋克风格变化,第二个百米是吉卜力风格,第三个是田园风格,这样排列组合的话我其实就有无数种的这个南京东路的这个形态出来。这也符合元宇宙的概念,它本身是无穷的想象。包括我提到的全民地球三维重建,你可以理解为这个重建的地球是无穷态的地球,空间地理位置是一致的,但可以有无穷态组合。 4.用户参与内容创作普及地球三维重建计划小六: 那这样的话比如说你们的用户,用你的app的话,他可以直接从你们的后台拉取一个,甚至他就坐在家里面,就可以拉取一个你们做好的3D场景。 康迂松: 对,在我的平台会有一个专门的模块,就是一个主题重建,比如说某个用户,他发起了一个南京东路重建。发起用户上传第一个点位的南京东路的空间后,第二个、第三个用户都依次加入进去,那这样的话你就有一个完整的南京东路。那可能我在家,我想去体验南京东路,我直接进这个主题空间体验就可以了。或者说我是专业用户,要在南京东路上去做二次的这个编辑创作,用在游戏或者影视动漫上,我就可以去把那些用户已经搭建好的这个空间拿过来,然后在这个基础上去做二次创作,或者作为游戏的地图,或者作为动漫的场景,或者做为影视的背景等等。我们一会还要聊商业模式,其实这部分就蕴含了巨大的商业价值。 小六: 对。听起来有点像众创地图。 康迂松: 对,就是给用户提供一个低门槛有趣的3D内容创作的工具和平台,吸引大家都来发3D朋友圈,形成足够的数据,在此基础上创建完整的大空间地图。 小六: 我知道之前有一些全景公司,他们做全景相机的他们会去做一些这种叫漫游式体验的,现在也有很多定点的比如博物馆的漫游,苏州园林的漫游,用全景相机去做。这种方式做出来的,跟你们这种方式做出来的有什么区别? 康迂松: 全景照片或者视频的形式它没办法去任意转换位置,也无法作为游戏影视动漫等的资产。狭义的3D它一定是可以自由转换位置和视角渲染的,是可以在任意的角度和位置去做渲染和交互的。但是全景相机的话,它只能说在相机的路径上,你可以去转换视角,然后去zoom in zoom out,比如说你用全景相机去拍了一圈的苏州园林,你是可以跟着他的相机的行进路径去前进后退,然后环视。但是你想要绕到亭子的另外一侧,就绕不过去了。而真正意义上的三维苏州园林,你是可以绕到亭子的另外一侧的。 我知道某租房业务公司,它早先下面有个团队,也用全景技术去做了一些示范性的场景,但是后来我没有看到更多的关于他们在三维重建和产品上的一些应用,估计他们可能没有过多的使用,或者说他们在做进一步的研发,又或者说他们放弃了这个技术路径,大概原因在于得要去现场做高精的数据采集,成本是很高的,而且只用于用户去看房,功能单一。另外的话就是他要去做很好的适配,我们看到他们的这个平台上是有一些是真3D的房屋的空间展示,但是大部分它还是基于全景照片,就是它是一个点位式的形态,我得跳转过去以后再去环视,所以它其实严格意义上来说,它不是3D,是伪3D,它仍然是照片,只不过是全景照片。 小六: 那你像这种街景地图,街景地图它是真3D还是伪3D? 康迂松: 另外某街景地图,你到里面,放大以后,左右两侧有箭头,前面后面有箭头,你点一下箭头,它啪跳过去,啪你点一下,又跳20米或者多少米,它其实还是照片。在某德上,它的3D地图,它有那个白模,那个是有一定的三维的交互在里面的,虽然主要是一些高低大小不一样的box,但是带有一定的3D的体验在里面的,它可以实现任意位置自由视角查看。 其实早先大厂们也想去做精致的3D地图的,就不是Box的那种,至少我知道有一家做过。因为当时我们跟这家大厂在这方面去做过相关的探索和尝试,就是能够把生成的模型,或者是用手工雕琢的,或者用测量的这个数据去融合到一张底图上去,然后推给C端用户用。但这里面遇到一个很大的问题就是数据量太庞大了,渲染的要求太高了。这就没办法去很好的去落地。我们前面提到的某德,他们就选择了用Box的这个形式去做了平衡。 小六: 那我们长远来说,你们产品如果从长远角度上来讲?假如说不考虑什么算力成本,你们也能做成3D版的地图 5.未来展望与规划康迂松: 其实我做好了地球三维重建就是做出来3D地图,可以融合到地图导航里面。这样导航的时候,就不是我们现在看到这个导航了,它就是一个真实的三维的导航,可以直观的看到我现在是在哪一个路口,我参考的这个建筑物长什么样,可以跟现实一模一样。你可以理解为就是一个现实世界的映射,然后在我导航的时候,在虚拟世界里面跟现实世界里面跑的这个路径和看到的画面其实是一样的。 小六: 你刚才说的时候我突然想到一个非常好的场景,但是我不知道你们有没有在做。室外导航已经有很多了,他们各种各样的采集。室内的像商场导航,我知道他们现在还是用那种比较传统的方法像UWB非常传统方法去做。 因为你这边不是手机嘛。大家在商场里有这么多手机,你如果能把商场的3D的模型给建出来。每个人在导航的时候他拿手机一拍,可能都不用拍手机对着周围稍微扫一扫,可以立马做定位。你再做这种导航楼层间的导航是不是都能做。 康迂松: 对,其实我这个三维地球重建不仅仅就是室外的这个重建,室内也可以去融合在一起的。比如说用户已经把K11的室内三维空间都搭建好了,你进到K11里面去,要找罗森,你可以通过手机摄像头拍一张照片上传,我们在后台将照片与三维的K11去做匹配,反算出来你的位置,然后手机中的三维K11也会跳转到你在的位置,给你辅助的空间导航,最终找到罗森。 6.如何看待目前商业前景以及有哪些潜在收入小六: 我觉得这个点商业价值很高,因为因为商场里面就需要这个,甚至你可以做排名。 康迂松: 对,排名点评推送,还有室内外导航都在我们的规划之内。规划里面还有AR,就是AR即便届时仍然不成熟,还不足以去支撑大众C端普及的时候,我们也可以采取这种类似于像电影院的这种模式。你进到商场,商场给你免费提供眼镜,然后你戴上眼镜以后,跟我的场景去做互动,然后我还会有一些激励机制,比如说你的角色,我在你导航的过程中,可以把你自己的角色融入进来,然后把一些虚拟的玩法融入进来。当你离开商场的时候,把AR眼镜再还回来。 小六: 我感觉挺有意思的。因为刚才提到这个,我们顺便聊一下商业化,毕竟你是创业者,肯定技术再好,各方面最终还是要考虑商业。 小六: 你们目前的这些产品。比如说一些设想和规划,他后面如果要落地到商业,他是怎么去做盈利? 康迂松: 我做的这个事情的商业价值不在当下,而是蕴含在未来的巨大市场规模和商业价值。三五年内主要是会通过设计有趣好玩的模块让C端免费持续大量的去分享、去创作3D内容。在积累了用户流量和3D数据以后实现商业的闭环。这个商业闭环的形式就非常的丰富了。首先是刚刚说到的排名、导航、线上线下的激励联动。然后就是广告,广告跟我们传统的互联网应用的区别是非常大的,我们现在的这个互联网应用,它主要的商业的闭环就是简单粗暴的开机广告,或者体验过程中的弹窗广告等形式,这是一个非常影响用户体验的一个商业逻辑。但在三维空间里面就不一样了,三维空间你可以在任何一个位置广告软植入,比如在南京东路这个场景,悬空的任何一个空间,你都可以去融入广告;也可以是某个品牌的数字人,或者某款车的IP, 以NPC或者可交互资产的形式在南京东路的空间,在你体验这个空间的时候可以过去互动,你看这个广告的形式其实就已经融入进来了,无形的营销。 小六: 很有意思。 康迂松: 很有意思,然后可以去做视觉效果。我可以把耐克或者说其他的商标融入到这个场景,当移动到某个点位的时候,它就触发这个广告,它就出现这样的一个虚拟的悬空的半透明的banner。另外的话就是在科普教育里面,比如说化学课程、生物课程的视频,比如说微生物世界,专业用户拍好视频以后,可以把它微生物世界、分子世界去重建出来,形成一个有趣立体可交互的课程体系,那学生去学习就有点像知识付费的形式了。还有文旅,比如上海豫园重建以后,我在它的某些特定的点位,去设置一些交互的玩法,当你体验时,激发了某个交互的玩法以后,我会给你一些激励,或者发券也好,或者积分也好,这个券和积分你可以到线下去兑换消费,线上线下的一个引流的互动。 康迂松: 还有就是具身机器人训练、自动驾驶仿真方面,这也是一个商业的点。再就是在游戏影视动漫,我有丰富的素材,去提供给专业用户做后期的编辑。最后我想提的是3D大模型,未来你要去做这个真正的3D世界大模型的时候,他肯定也要用3D数据去训练和推理,而现在互联网现有的3D数据,相比于文字、图片、视频、声音的话,可以基本忽略为是零。那我就可以借助这种C端创作的这个3D数据来给他提供这个数据服务,这也是我另外的一个商业闭环的规划。 小六: 明白,我理解一下就是C端免费,然后我们得到这样的3D数据,然后基于这个积累的用户流量和3D数据,我们可以去做很多TO B的这个商业模式。 7.AR/VR技术落地与跨平台应用康迂松: 对,我说的大胆一点。现在互联网的应用以及商业模式都可以融到这个应用里面。其实这个产品最佳的状态应该是在AR、VR上,因为它的沉浸感更强,但是目前我要去平衡这个硬件门槛,我要提供一个低门槛的入口给到用户,所以就会牺牲一部分的沉浸式,在手机端作为一个过渡,然后未来在AR、VR上去做移植和对接。 小六: 我觉得这个思路是很棒的,你得先让用户去拿到数据,用户开始用起来有了数据之后,后面再说。 小六: 那车机上它的摄像头也可以接入是吧,也可以接入你这个应用? 康迂松: 可以接入。一样也可以接入的,就是包括无人机也可以,你只要提供视频素材上传都可以。然后可以跨端去交互,在手机上,在车机上或者pad上,也可以在电脑上去进行交互。 小六: 对。我对3DGS三维重建它的理解更深入了,我之前考虑娱乐为主,就觉得这个事情可能大家用来看一看,发个朋友圈看起来比较好看,然后展示为主,然后他的商业化一直没有想的特别好,今天跟你聊了之后我觉得至少对这个行业是非常有信心了。 康迂松: 其实刚刚开始你还提了一个问题,我还没有回复。就是你问的,市场上有没有类似的这个产品。其实是有很多在做的类似的团队,但是跟我们做的产品一样的是没有的,比如说LUMA AI,国内也有一家类似的。但是他们都有一个共性的问题,就是偏重学术和科研,偏院校为主,他没有往工业落地的路径去深入下去做,选择了先做专业用户。这里面其实是个跨领域视野的问题,视野会局限你做事情的方向。就是你得要有计算机图形、计算机视觉等3D技术在智慧城市、游戏、影视动漫,仿真、文旅、地产、社交等领域的应用视野,你知道这些应用场景是什么,技术是怎么用的,存在什么问题,现在应该怎么做等等。你有这些市场洞察、技术的理解、跨领域应用视野,你就会知道它这个技术怎么样去融合到原有的这个市场里面,如何去选择定位,或者是去把原来的这个市场去做覆盖,或者去做这个变革、提升和创新。对行业和这个技术信心,某种意义上也来自于这些综合信息的深刻理解。 另外就是这个技术已经引起了相当的关注,至少在学术科研圈引起了广泛的关注,大家都在往这个方向积极去做研究,这对于我们来说也是一个利好,会有很多新的突破,我们也看到,基本是每天出SOTA, 比如说shade,relighting,stylization,editing,这些研究也会越来越丰富,以后对于我们来说也越来越友好。 小六: 我刚才想问的就是你提到了重建的精度。传统的流程肯定是精度比较高的,你像现在用手机去做的话,我不知道你讲的精度是指哪方面,是指这种resolution分辨率这方面,还是说考虑它的几何精度? 康迂松: 目前主要是在resolution上,还有photo realistic,这个概念上的精度是可以比较友好的去实现的。我现在不去做mesh和geometry,现在有很多的团队院校,他们都是在突破mesh和geometry,去做高精度模型去重建。这个路径,从学术和科研的角度来说是非常有意义的,未来也能极大的赋能传统图形工业流程,但是当下去做工业的落地、商业的落还不成熟,属于一个高不成低不就的状态。就是对于专业用户,即便你给我搭建了这个mesh,我在后期其实也用不上,因为我还是要按照我的流程标准要求,去做二次编辑,那二次编辑带来的难度和工作量可能还不如我自己按原来的流程去做。对于普通用户来说,他们care Mesh, 他拿到这个mesh没有任何意义,所以目前我不侧重模型的高精度重建,更侧重大众C端的用户交互体验。 小六: 所以是现在先做大众的,先把这个做好,然后等到那个技术成熟了,到时候再移过来。 康迂松: 对,是这个路径。我现在先实现有三维空间的体验,完了mesh和geometry放到第二阶段。 8.您认为目前面临的主要挑战是什么小六: 好,我们下一个问题,刚才聊的就是感觉未来已来,感觉这个趋势特别好,那我们就实际一点。在这个场景里面,不管是你们现在做的,还是说我们就未来大宏图下有哪些现实的难题?在这个过程中,不管是技术方面还是商业方面。 康迂松: 首先刚刚我提到一个硬件的低门槛,第二个就是你创作的低门槛,也就是我拍摄的时候。不能像LUMAAI 一样,里三层外三层,那这样的话,门槛就拉高了,刚开始就会把用户劝退,这个是也是我们要突破的,要在拍摄的时候尽量给用户少设置门槛和限制,让他能够自由的拍摄,这是第二个。然后第三个就是在交互上,因为手机的这个屏幕毕竟是有限的,而且它是二维的。那么在交互上也要去做一个创新的产品设计和低门槛的交互创新。另外还有重建的时间、实时重建、异源数据的融合、空间计算匹配等等,这些都是在我们产品规划的功能里未来会遇到的技术难度,这些技术目前都是无人区。 但现阶段我觉得最主要的挑战是在采集和交互上的一个创新,这是需要突破的很重要的一个点。 小六: 你刚才讲交互,像在手机上也没有啥交互,就只能是拉伸这种。你刚才指的交互是指哪种交互? 康迂松: 类似于UI界面。 小六: UI的交互? 康迂松: 对,UI的界面,我们要设计一个创新的UI界面去跟3D朋友圈做互动,还有就是让3D朋友圈跟3D朋友圈之间的互动,以及用户和用户之间的互动,这就是我们说的创新交互的挑战。 小六 Ok,还有一个问题,你刚才提到拍摄门槛。确实LUMA我都用过,我发现是这样的,人家让那么做是有道理的,你不那么做出来效果很差。 康迂松: 做出不来对吧。这跟他们的市场定位相关,因为他们定位的就是是要去做高精度的mesh geometry,或者没有floater没有重影的更photo realistic的重建,所以它对于数据采集就有很高的要求了,那这样的话你就会劝退用户。 小六: 你的意思是用户其实愿意承担?它的效果没那么完美,但是它可能比较有趣,比较好玩,然后来抵消这一部分。 康迂松: 对。对于普通大众用户,只要有有趣好玩的3D体验,可以在重建的精度和效果上妥协。 小六: Ok 那最后一个问题。关于个人的,一方面你觉得现在3DGS很火,很多人在研究,其实我们平台我自己很关注,我们平台也发了很多相关的学术方面的文章最新的动态都会有。你对这个大方向,我刚才感受到你对他非常有热情,然后觉得一定是未来的这样的一个态度,就你个人之前也做了各种各样的事情,然后到你现在这个创业,这个过程中你是说因为我做这个,所以我看好他吗? 康迂松: 不是,不是因为我做这个我才看好它。是它本身就非常有发展前景,而我的产品恰恰遇上了它,它也促成了我的这个产品能有更好的形态。我要做这个产品,找到了3DGS, 3DGS又让我觉得可以更好的做这样的一个产品,并且在做的过程中我发现在传统图形领域这个技术还可以做的更多,甚至图形领域做不到的它都能做到,我觉得这个技术未来很大程度上可能会颠覆,或者保守的说,会给传统图形工业流程带来很大的变革,那这个事情就很有意思了。 小六: 所以你其实是先有需求,然后我再拆解需求,再想怎么去解决,然后再到这里?这个我觉得是一个非常好的方法。很多技术出身的人,拿锤子找钉子这很容易出问题,你要去硬套一些场景。你对想要进入行业的人有什么建议吗? 康迂松: 我觉得其实如果单纯去做这个技术去研究的话,我觉得只要想进来的人,他有一定的基础的话,可以很快的pick up,就是说你读够多的这个论文,可以很快找到一个研究方向,发一篇论文其实也很快的,因为这个技术才刚起步,有很多需要研究和突破的。但是如果说你真想干事,你想去做一些有影响力的产品,或者说你未来想要去在商业上去做这个切入的话,或者说要有更宏远系统的技术研究规划的话,我建议去多了解传统图形工业流程,多了解影视动漫游戏,包括这个智慧城市、数字孪生、仿真这些应用,可以有更好的视野去帮助你去选择应该要去突破的方向。 小六: 明白。外人看来那我直接学博士期间的东西就行了,他就觉得你本科硕士都不需要,但实际上你的意思是说你之前那些传统的,那些别人觉得过时的东西,就有一些传统的东西还是得了解,对整个行业的理解得够。 康迂松: 就是它会帮助你去构建一个系统性的思维,一个全局的视野。你会知道这个技术在全局里面扮演一个什么角色,现在处在一个什么阶段,未来它会跟传统的生态怎么融合,给现有的产业带去怎么样的变革。你会有一个比较清晰的定位,知道自己现在在哪,应该往哪个方向去突破,以及未来你要面对的是一个什么样产业格局。 小六: 明白。感谢康总的分享。 康迂松: 谢谢程博! 也借程博CV life这个平台摇下人。欢迎对我们产品感兴趣的技术、产品、交互领域的海内外同学多跟我们交流提建议,也非常欢迎有意愿的同学加入我们,和我们一起创造未来,实现全民地球三维重建的愿景。欢迎通过邮箱或者电话联系。ahhkys@163.com, 也可以在LinkedIn和Twitter上Follow我,直接搜索Easson Kang就可以找到我。再次感谢程博! 「 小六的机器人AI圈」知识星球,致力于为机器人AI行业从业者提供从入门、学习、交流、求职、线下链接、合作、、创业、行业内幕、咨询、答疑等一系列的服务。 我们星球里有“大咖分享”独家内容,星主采访业内优秀的从业者形成独家深度优质文章,内容涵盖行业技术趋势、经验分享等内容,“听君一席话,胜读十年书”,目前已经更新的部分内容
0 阅读:0

科技视觉大放送

简介:感谢大家的关注