文档章节

台湾是如何应用大数据分析提高半导体竞争力

 数据分析师
发布于 2015/04/16 14:27
字数 1213
阅读 30
收藏 0
点赞 0
评论 0
自引进IC封装开始,台湾半导体产业已发展40余年,近年来总产值已近20,000亿元新台币,在全世界占有一席之地。半导体产业竞争力来自於成本、良率及交货时间,其中良率更是一家公司有竞争力之所在。近年来自动化生产及物联网(技术发展,使得所有半导体制程相关的数据得以蒐集与保存,这些数据包含产品数据、机台数据、量测数据、缺陷机数据、晶圆接受度测试数据及晶圆测试数据,如何有效的使用这些大数据数据一直是半导体产业重要的课题之一。除了提升产品良率之外,产品/制造流程缺陷追踪、供应计画、提升能源效率…等都可以利用大数据分析提升公司竞争力。
大数据
  处理这些数据主要可分成三个步骤:数据前处理、数据分析、验证与评估。在数据前处理时必须先修正数据错误,常见的数据错误有以下两种:

  1.数据出现异常值。透过盒须图可轻易的分析出异常值,通常发生的在设备工程师在调整机台的时候或是由其他外在因素造成,因此这样的值通常直接删除。

  2.数据出现遗漏值。因侦测设备的限制,有时数据会有不完整的情况,处理这样的状况可透过补值的方式(内插法、平均法等)回填可能的数据或直接删除该笔数据。

  因每种数据的性质与内容不同,为有效使用这些数据,将数据库整合为必要的步骤。如何整合这些数据库首先需考量实际问题需求,再来考量数据库数据的型态,例如机台数据为连续型数据、缺陷机数据为离散型数据,因应不同的数据型态必须选择不同的方式去做合并。

  在数据分析处理上,常见的方式可分成以下几种方式:

  1.利用数据分群演算法,例如K-means演算法、阶层式分群演算法将原始数据分群。

  2.将分群好的数据透过决策树找出造成问题发生的可能因子,或透过机器学习演算法,例如SVM建立模型,预测问题是否会发生,藉此实作出预警系统。

  数据分析完之後必须评估结果是否符合现实以避免过适现象。在此步骤往往会发生分析结果和过往经验不一致的情况,除了花许多时间与工程师沟通确认之外,还需找不同的数据集交互验证,已确保数据分析方式是可行的。

  在处理大量的 大数据时面临到许多的挑战,例如:传统的分析工具与方法通常适用在小规模的数据上,当数据量大且复杂时往往失去其效用、分析数据需耗费大量的计算时间,如何快速的处理大量数据是一项大的挑战。近年来已有一些工具可解决以上的问题,例如:MLlib即可支援一些机器学习的套件在Spark平台、RHadoop及SparkR套件可支援R的分析工具在Hadoop及Spark平台上。除了在分析数据时面临的挑战之外,TATA Consultancy Services(TCS)顾问公司在2013年从其他面向提出在处理大数据数据时面临的许多挑战,举例来说:数据工程师需取得部门经理的高度信任、对於不同的商业决策需决定该使用哪些数据、利用大数据分析帮忙部门经理做决策…等,以上的问题待管理相关的人员来解决。

  对於半导体产业来说,透过大数据数据分析历史数据,挖掘其中有用的资讯以提升公司竞争力是非常有效的一种方式。科技部与台积电在2014年下半年即举办相关的比赛,希冀发掘半导体相关数据的各种有用资讯。相信往後会有越来越多人力与资源投入这领域,让半导体产业迈入新的世代。

---------------------------------------------------------------------------------------------------------------------------------

了解更多商业智能行业资讯,商业智能解决方案以及商业智能软件下载请访问FineBI商业智能官网www.finebi.com

或扫一扫,关注“FineBI专业商业智能解决方案”(微信号:fine_bi

数据分析职业有没有前景 - IBFINER - 商业智能

© 著作权归作者所有

共有 人打赏支持
粉丝 29
博文 1645
码字总数 2338861
作品 0
邢台
从这组数字,了解台湾半导体的真正实力

中国台湾地区“经济部”今(5)日公布产业经济统计,在行动装置普及化加上规格升级、物联网、车用电子及高速运算等新兴应用扩增,推升台湾半导体产业出口屡创新高,由2011年出口564亿美元,增至...

技术小能手
06/06
0
0
中国“芯片之城”崛起:首座16纳米晶圆厂正式出货,20个月即实现量产

  日前,台积电南京厂总经理罗镇球出席“芯片之城”南京江北新区“两城壹中心“招商会透露,南京 12 寸厂这个月已开始出货。      图丨台积电南京厂总经理罗镇球出席“芯片之城”南京江...

DeepTech深科技
04/28
0
0
CIO时代APP微讲座:南京邮电大学李涛深度解读大数据时代的数据挖掘

3月13日下午,南京邮电大学计算机学院、软件学院院长、教授李涛在CIO时代APP微讲座栏目作了题为《大数据时代的数据挖掘》的主题分享,深度诠释了大数据及大数据时代下的数据挖掘。 众所周知,...

玄学酱
04/16
0
0
“万众一芯,点石成晶”北京峰会,齐聚半导体各界菁英探讨“中国芯”

  中美贸易大战的背景下,“中国芯”成了眼前最热议题,已扬帆启航的国家集成电路产业基金 (大基金) 针对设计、制造、封测、材料设备等每个关键环节作覆盖式投资,目标是提升整体集成电路产...

DeepTech深科技
04/28
0
0
TCL联手紫光集团打造百亿产业并购基金

  【IT168 云计算】继2月22日TCL公告与紫光集团共同发起设立产业并购基金之后,2月23日下午,TCL携手紫光集团在北京举行产业并购基金启动发布会。发布会上,双方共同宣布,将充分利用双方在...

it168网站
2016/02/23
0
0
创“芯”,聚变,共赢——第二届IC咖啡国际智慧科技产业峰会圆满落幕!

本届峰会以创芯、聚变、共赢为主题,半导体行业大咖、企业家、投资人等300位产业链上下游的伙伴以及媒体朋友们汇聚一堂。 近日,由IC咖啡主办的ICTech Summit 2018第二届IC咖啡国际智慧科技产...

行者武松
04/11
0
0
中国半导体行业发展的最佳时机已到

据媒体报道,全球半导体行业将在物联网、人工智能、5G和量子技术应用领域迎来更多的增长,终端市场正在经历越来越多样化和分布式特征,比如智能汽车、智能城市、智能医疗和AR/VR等等。嵌入式开...

gunser
03/21
0
0
江苏省再次发力新一代人工智能产业,企业引顶尖人才最高资助1亿元

本报讯 我省最近印发《江苏省新一代人工智能产业发展实施意见》(下称《意见》),提出力争到2020年,江苏人工智能产业规模和总体竞争力处于国内第一方阵,成为全国人工智能产业创新发展的引...

dongnaoandroid
05/23
0
0
MCU供应短缺,价格持续暴涨

消费电子带动中国MCU市场快速成长,据报道,近日,欧洲半导体巨头NXP公司对其代理商发出了涨价通知。通知称,将从2018年第一季度开始对NXP旗下MCU(微控制器)、数字化网络、汽车微控制器等主要...

gunser
2017/12/25
0
0
大统计与数据科学联合会议召开 百分点深入探讨大数据价值挖掘之道

5月27日-29日,由百分点集团、中国人民大学、北京大学、伦敦政治经济学院与统计之都共同主办的中国最大的大数据盛会“大统计与数据科学联合会议”在北京召开。28日,百分点集团与北京大学携手...

玄学酱
05/24
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

32.filter表案例 nat表应用 (iptables)

10.15 iptables filter表案例 10.16/10.17/10.18 iptables nat表应用 10.15 iptables filter表案例: ~1. 写一个具体的iptables小案例,需求是把80端口、22端口、21 端口放行。但是,22端口我...

王鑫linux
今天
0
0
shell中的函数&shell中的数组&告警系统需求分析

20.16/20.17 shell中的函数 20.18 shell中的数组 20.19 告警系统需求分析

影夜Linux
今天
0
0
Linux网络基础、Linux防火墙

Linux网络基础 ip addr 命令 :查看网口信息 ifconfig命令:查看网口信息,要比ip addr更明了一些 centos 7默认没安装ifconfig命令,可以使用yum install -y net-tools命令来安装。 ifconfig...

李超小牛子
今天
1
0
[机器学习]回归--Decision Tree Regression

CART决策树又称分类回归树,当数据集的因变量为连续性数值时,该树算法就是一个回归树,可以用叶节点观察的均值作为预测值;当数据集的因变量为离散型数值时,该树算法就是一个分类树,可以很...

wangxuwei
昨天
1
0
Redis做分布式无锁CAS的问题

因为Redis本身是单线程的,具备原子性,所以可以用来做分布式无锁的操作,但会有一点小问题。 public interface OrderService { public String getOrderNo();} public class OrderRe...

算法之名
昨天
9
0
143. Reorder List - LeetCode

Question 143. Reorder List Solution 题目大意:给一个链表,将这个列表分成前后两部分,后半部分反转,再将这两分链表的节点交替连接成一个新的链表 思路 :先将链表分成前后两部分,将后部...

yysue
昨天
1
0
数据结构与算法1

第一个代码,描述一个被称为BankAccount的类,该类模拟了银行中的账户操作。程序建立了一个开户金额,显示金额,存款,取款并显示余额。 主要的知识点联系为类的含义,构造函数,公有和私有。...

沉迷于编程的小菜菜
昨天
1
0
从为什么别的队伍总比你的快说起

在机场候检排队的时候,大多数情况下,别的队伍都要比自己所在的队伍快,并常常懊悔当初怎么没去那个队。 其实,最快的队伍只能有一个,而排队之前并不知道那个队快。所以,如果有六个队伍你...

我是菜鸟我骄傲
昨天
1
0
分布式事务常见的解决方案

随着互联网的发展,越来越多的多服务相互之间的调用,这时候就产生了一个问题,在单项目情况下很容易实现的事务控制(通过数据库的acid控制),变得不那么容易。 这时候就产生了多种方案: ...

小海bug
昨天
3
0
python从零学——scrapy初体验

python从零学——scrapy初体验 近日因为一些事情,需要从网上爬取一些东西,故而想通过使用爬虫来顺便学习下强大的python。现将一些学习中遇到的问题记录下来,以便日后查询 1. 开发环境的准...

咾咔叽
昨天
1
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部