我的控制台 会员登陆 免费注册 最后更新 高级搜索 返回首页 我要投稿 退出登陆 立群文集 联系我们
当前在线: 0
小说《天各一方》
小说《从军四剑客》
留学加国
民主和法制
议论文
时事评论
改革和国策
文革探讨
政治理论
随笔
发表的专业学术论文
《小狗Lucky传奇》
小说《二十一世纪大棋局搏弈》序言
《二十一世纪大棋局搏弈》第一部
《二十一世纪大棋局搏弈》第二部
《二十一世纪大棋局搏弈》第三部
《二十一世纪大棋局搏弈》第四部
小说《开垦北大荒记事》
[生活特区] - 文学专栏 / 议论文 / 大数据分析不能停留在快餐阶段,要深入到各行各业的基础理论研究
大数据分析不能停留在快餐阶段,要深入到各行各业的基础理论研究
2021-01-15    范立群    《天一阁》范立群文集    点击: 232
大数据分析的广泛应用
现在大数据分析可是个十分时髦用词。凡是通过信用卡,或网上交易的,凡是被摄像头拍到的踪影都会留下记录,被成为大数据分析的依据。比如,美国特工奉命要追踪,猎杀某个人。根据他所属单位,同僚的行踪,他的信用记录,行踪搜索,就可以准确定位,再配合内线情报,精准猎杀就变得轻而易举。商家根据大数据分析统计,可按各种货品的交易量调整采购量和库存,根据消费者的购物心态变化判断市场潮流的走向。再如环保工作者,他们可以根据网上统计的全球石油,煤炭等不可再生能源每年递增的消耗量,加上冰川的坍塌,冰雪消融的加剧,大胆预测地球的暖化和海平面的上升。乖巧的政客们可以根据大数据分析选民的族群,宗教,职业,收入,消费习惯,加入的社会组织,政治倾向,目前生活状态,把满足多数人的诉求作为自己选票的保障。 这些都是从大数据分析中可以直接获取的,属于速食快餐方式。从实用主义角度出发,这么做无可厚非。至于这样做的后果,是否反映了自然和社会发展的客观规律?是否反映了各行各业发展的实际情况?那就不好说了。2020年的美国大选,正是这种速食文化把美国号称无所不能的民主政治搞得支离破碎。加强环境保护,减少石化燃料和核能利用的污染排放,这当然是政治正确,人人有责。然而冰川的堆积和坍塌,冰雪消融,地壳运动,山崩地裂,地震,海啸,火山喷发,雷鸣闪电,森林大火,自古以来就持续在发生。地球的冷热周期温度变化是一个受到太阳黑子活动周期,地壳碰撞火山喷发活跃周期,地球磁场变化周期,地球的生态演变和地球以各种方式向外散发能量等主导因素影响下的能量相对平衡,失衡,再达到平衡的过程。 这些地球暖化论者是否计算过太阳一天对地球的热辐射能量需要燃烧多少兆亿吨石油,或煤炭才能替代?太阳黑子活动的周期性变化,对地球热辐射能量强弱的差别相当于多少兆亿吨有机石化燃料的燃烧热量?大型的火山喷发,火山灰遮天蔽日,所阻挡的太阳热辐射热能相当于多少兆亿吨石油,或煤炭的燃烧热量?雷鸣闪电,森林大火,地震,海啸,所释放的能量又如何?对这些重要因素全都视而不见,对随着工业化人类与日俱增的能量消耗在上述各种巨大能量中所占的比重不做出估算,怎么能回答在没有人类之前地球的冰河期和大洪水冷热交替的周期变化会受到人类活动的多大影响? 地球暖和论者就凭手上掌握的这些片面,局部的资料就能做出“地球暖化”这么大的结论?这是在厨房烧开水哪?只有根据所有地质勘探所收集到的地球气侯变化历史资料,人类有限历史所记载的气候资料设立数据资料库,通过计算机模拟出地球的冷热周期变化历史,再加上人类活动所带来的影响比重,才能展开这种基础理论的大数据分析,得到靠谱的结论。否则怎么回答近些年海平面非但没有上升把太平洋岛国淹没,地球反而将进入转冷的周期? 二十一世纪随着数据通讯,数据储存和计算能力的大发展,数学模型,大数据分析被广泛地应用到各行各业,这是一个值得庆幸的大好事。然而,大数据分析和数学模型应用不能只停留在表象,简单满足于直接速食方式,更多应该深入地进行自然和社会发展规律的基础理论探索。在微信上看到一篇“中央罕见强调,这个行业被‘卡脖子’比芯片还可怕”(来源于大猫财经)。这是一篇谈论到中国动植物遗传育种现状的议论段子。此文说到的正是本人的专业领域。上个世纪八十年代中后期,“造的不如买的,买的不如租的”歪理论横行,对中国的动植物遗传育种领域的打击极大。农业上热衷于盲目引进转基因作物,为孟山都大开国门。畜牧业上连续多年大批组织采购团,到西欧,北美把洋人种畜场的淘汰种猪,种牛,种禽收罗一空,花大价钱帮人家清了场子。这样做的同时,也彻底把中国的畜牧研究所(从上到下),中国自己的家畜育种基础给砸烂了,断绝了家畜遗传育种专业留学在海外的学子学成后报效祖国的回家之路。 大数据分析并非始于当下,随着计算机运行速度和数据储存能力的不断提升,在上个世纪八十年代末,大数据分析已经提到了议事日程。在家畜育种方面,在百多年的良种登记,性能测定数据记录的基础上数据库的设立,北美超大型计算机的应用,动物数学模型BLUP和BLUE最佳线性无偏估计和预测理论的成熟,大数据分析顺势而为。本人在加拿大家畜遗传改良研究中心(CGIL)Guelph大学的博士论文(1),(2)和在加拿大农业部 Lethbridge研究中心的工作(3)都是基于大数据分析。当然,要做好《动物饲料报酬的遗传率》这种基础理论的课题研究,除了遗传,育种,营养,繁殖等专业知识外,必须完整掌握数理统计分析理论,数学模型理论,熟练计算机编程和超大型计算机(当时的)操作。基于上述这几项研究,由多基因控制的动物性状的遗传率一般是在百分之十五左右的结论已被广泛接受。 话说当年被抛弃,或制约的专业基础领域恐怕远远不止动植物遗传育种。现在要追赶也不是一日之功,首先必须克服急功近利,唯利是图的近视眼光。各行各业的基础理论研究必须步步稳扎稳打,精益求精,只有基础扎实才能发挥它的优势。建立各行各业发展的数据资料记录系统,设立数据库势在必行。如畜牧业的良种登记,性能测定,建立数据资料记录系统和数据库。畜牧业的这套记录系统在发达国家已经有百年以上的历史,至今中国尚无,要追赶就必须从基础做起,没有投机取巧的可能。 建立起中国自己的研究中心,如畜,禽和鱼类的遗传育种研究中心,把中国的品种资源,良种繁育,这畜牧业的命脉牢牢地掌握在自己手中。世界中等以上国家都有各自的家畜遗传育种中心,在掌控自己国家的品种资源,把握畜牧业命脉上没有一个国家会缺席,只有中国放弃了。中国是一个品种资源大国,现在如果想急起直追还为时不晚。等到中国的品种资源被消耗殆尽,中国的畜牧业那就只能永远沦为在生产链下游,被人卡脖子,仰人鼻息的受气包了。 中国现在经济上已经上升为世界老二,但付出的代价及其昂贵。工业生产上也许门类齐全,但是很多基础研究领域尚残缺不全。一旦国际政治动荡,贸易冲突,金融危机,或爆发战争,被卡脖子,要命的领域还多的是。要补课,要追赶的就得赶早不赶晚,千万别等到脖子被卡上了才后悔莫及。中华民族从来就不缺人才,只看政府是否有长远的战略眼光?能否创造必须的条件,合理地使用好人才?只要政府发出号召,确实想迎头赶上,中华儿女凡有一技之长的都会踊跃响应,也能在国际市场上招募到没有政治偏见,只图发挥所长的各行各业尖端人才。大数据分析只有深入到各行各业的基础理论研究才能发掘其无穷尽的潜力。 1. Fan, L. Q., J. W. Wilton, and P. E. Colucci. 1996. “Genetic parameters for feed intake and efficiency in dry pregnant beef cows.”, 加拿大动物科学学报(Canadian Journal of Animal Science)., 76(1): 73-79. 2. Fan, L. Q., J. W. Wilton, and P. E. Colucci. 1996. “Genetic parameters for feed intake and efficiency in lactating beef cows.”, 加拿大动物科学学报(Canadian Journal of Animal Science)., 76(1): 81-87. 3. Fan, L. Q., D. R. C. Bailey, and N. H. Shannon. 1995. ” Genetic parameter estimation of post-weaning gain, feed intake and feed efficiency for Hereford and Angus bulls fed two different diets.”, 动物科学学报(Journal of Animal Science)., 73(2): 365-372.
责任编辑: wenxue
发表评论 查看评论 加入收藏 Email给朋友 打印本文
如果你想对该文章评分, 请先登陆, 如果你仍未注册,请点击注册链接注册成为本站会员.
平均得分 0, 共 0 人评分
1 2 3 4 5 6 7 8 9 10
Copyright © 2004 -2005 [生活特区] - 文学专栏
All rights reserved.
Powered by: Radiance Article Version 2005