本专业您将学到的内容有
- 正确分析和应用回归分析工具对变量之间的关系进行建模,并在给定一组输入变量的情况下进行预测。
- 根据实验设计中的最佳实践成功进行实验。
- 使用高级统计建模技术(如广义线性和加法模型)对各种真实世界的关系进行建模。
学习本专业您将获得的技能
- 线性模型
- R 编程
- 统计模型
- 回归
- 微积分
- 和概率论。
- 线性代数
关于本专业的课程
统计建模是数据科学的核心。精心设计的统计模型允许数据科学家从数据中存在的有限信息中得出有关世界的结论。在这三个学分序列中,学习者将在其数据科学工具包中添加一些中级和高级统计建模技术。特别是,学习者将精通线性回归分析的理论和应用;方差分析和实验设计;以及广义线性和加法模型。重点将放在使用R编程语言分析真实数据上。
本专业的学习项目
学习者将通过自动评分和同行评审的Jupyter Notebook作业掌握统计模型的应用和实施。在这些作业中,学习者将使用真实世界的数据和先进的统计建模技术来回答重要的科学和商业问题。
关于本专业的学习书籍介绍:
《方差、设计和回归分析:不平衡数据的线性建模(Analysis of variance, design, and regression: linear modeling for unbalanced data)》
《方差、设计和回归分析:不平衡数据的线性建模》
《方差、设计和回归分析:不平衡数据的线性建模,第二版》介绍了用于建模数据的线性结构,重点是如何将有关数据结构的特定想法(假设)合并到数据的线性模型中。本书通过使用易于扩展到大数据的工具仔细分析了小型数据集。这些工具也适用于从大数据中提取的小型相关数据集。
第二版新增内容
- 重新组织以专注于不平衡的数据
- 使用非平衡数据方法重新设计平衡分析
- 非参数和套索回归简介
- 一般加法和广义加性模型简介
- 检查同源因素
- 不平衡分割图分析
- 广义线性模型的扩展
- 作者网站上的 R、Minitab® 和 SAS 代码
该文本可用于各种课程,包括为期一年的回归和方差分析研究生课程,或针对高年级统计学学生和其他领域的研究生的数据分析课程。它非常强调解释处理不平衡数据时遇到的计算机输出范围。
《使用 R 进行离散数据分析:分类和计数数据精装的可视化和建模技术(Discrete Data Analysis with R: Visualization and Modeling Techniques for Categorical and Count Data)》
《使用 R 进行离散数据分析:分类和计数数据精装的可视化和建模技术》
用于分析分类数据的现代图形方法的应用处理 《使用 R 进行离散数据分析:分类和计数数据的可视化和建模技术》提出了对分类数据分析的现代方法的应用处理,包括离散响应数据和频率数据。它解释了如何使用图形方法来探索数据、发现异常特征、可视化拟合模型和显示结果。本书专为社会和健康科学、流行病学、经济学、商业、统计学和生物统计学领域的高级本科生和研究生以及可以将这些方法与自己的数据和分析一起使用的研究人员、方法学家和顾问而设计。
除了描述必要的统计理论外,作者还说明了这些技术在大量实质性问题中的实际应用,包括如何组织数据,进行分析,生成信息图表以及评估图形揭示的数据。本书的第一部分包含有关离散数据的图形方法、基本 R 技能以及拟合和可视化单向离散分布的方法的介绍性材料。第二部分侧重于简单的传统非参数测试和探索性方法,用于在双向和更大的频率表中可视化关联模式。本文的最后一部分讨论了用于分析离散数据的基于模型的方法。Web 资源 使用的数据集和 R 软件,包括作者自己的 vcd 和 vcdExtra 软件包,可在 http://cran.r-project.org 获得。
《R统计建模:生命科学家的双频率和贝叶斯方法(Statistical Modeling With R: a dual frequentist and Bayesian approach for life scientists)》
《R统计建模:生命科学家的双频率和贝叶斯方法》
迄今为止,统计学倾向于整齐地分为两种理论方法或框架:频率主义(或古典)和贝叶斯主义。科学家通常根据问题的性质和复杂性,并根据他们的个人观点和先前对概率和不确定性的培训,选择统计框架来分析他们的数据。尽管教科书和课程应该反映和预测这种双重现实,但它们很少这样做。这本易于理解的教科书解释、讨论和应用频率主义和贝叶斯理论框架,以适应不同类型的统计模型,这些模型允许分析生命科学家最常收集的数据类型。它以非正式、平易近人和渐进的方式呈现材料,适合只有微积分和统计学基础知识的读者。
R统计建模面向生命科学领域的高年级本科生和研究生,专业研究人员和从业者,旨在加强他们对定量方法的理解,并将其成功应用于现实世界的场景,无论是在生态学,进化,环境研究还是计算生物学领域。
《应用建模技术和数据分析2:金融,人口,随机和统计模型和方法(Applied Modeling Techniques and Data Analysis 2: Financial, Demographic, Stochastic and Statistical Models and Methods)》
《应用建模技术和数据分析2:金融,人口,随机和统计模型和方法》
数据分析是一个科学领域,随着科技行业的快速增长,以及计算技术的广泛适用性以及分析工具的新进展,数据分析是一个持续巨大增长的科学领域,最显着的进步是在过去的几十年里。建模使数据分析师能够识别关系、进行预测,并更具战略性地理解、解释和可视化提取的信息。
本书包括有关该主题的最新进展,满足了科学界广泛圈子日益增长的需求。应用建模技术和数据分析 2 是许多领先的科学家、分析师、工程师、数学家和统计学家的集体工作,致力于数据分析和建模应用程序的前端。这些章节涵盖了上述科学领域当前关注的问题和研究兴趣的横截面。收集的材料分为适当的部分以及适当的应用部分,为读者提供有关数据分析方法,模型和技术的理论和应用信息。
《工程和管理中的多元统计建模(Multivariate Statistical Modeling in Engineering and Management)》
《工程和管理中的多元统计建模》
本书重点介绍从业人员的问题解决和多变量情况下的模型构建。本书帮助读者理解这些问题,例如了解可变性、提取模式、建立关系和做出客观决策。书中涵盖了大量的多元统计模型。读者将学习如何将实际问题转换为统计问题,以及如何将统计解决方案解释为实际解决方案。
主要特点:
- 将数据生成过程与多变量域中的统计分布联系起来
- 提供估算已开发模型参数的分步过程
- 为数据驱动的决策提供蓝图
- 包括与目标受众相关的实际示例和案例研究
这本书将帮助参与数据驱动问题解决、建模和决策的每个人。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。