(一)探索随机变量及其分布:概率世界的魔法

2023-09-13 09:26:08

🍋引言

随机变量(Random Variables)是概率论和统计学中的一个重要概念,它们允许我们描述不确定性,并用数学方法来分析各种随机现象。本文将深入探讨随机变量及其分布,以揭开概率世界的神秘面纱。

🍋什么是随机变量?

随机变量是一个数学对象,它代表一个随机实验的结果,这个结果可以是一个数值。随机变量通常用大写字母(如X或Y)表示,而小写字母(如x或y)表示具体的数值。随机变量可以是离散的或连续的。

🍋离散随机变量

当随机变量只能取有限个或可数个数值时,我们称其为离散随机变量。例如,抛硬币的结果(正面或反面)就是一个离散随机变量。

🍋连续随机变量

当随机变量可以取无限个数值,并且通常与实数轴上的某个区间相关时,我们称其为连续随机变量。例如,温度、身高等连续性测量都可以用连续随机变量来描述。

🍋随机变量的概率分布

每个随机变量都有一个与之相关的概率分布,这个分布描述了随机变量可能取到每个数值的概率。以下是两种常见的概率分布类型

🍋离散概率分布

🍋0-1分布(Bernoulli分布)

0-1分布是最简单的离散分布之一,用于描述只有两种可能结果的随机试验,比如抛硬币(正面或反面)、点击广告(点击或不点击)等。其概率质量函数(PMF)如下:
P ( X = x ) = { p 如果  x = 1 q = 1 − p 如果  x = 0 P(X = x) = \begin{cases} p & \text{如果 } x = 1 \\ q=1-p & \text{如果 } x = 0 \end{cases} P(X=x)={pq=1p如果 x=1如果 x=0

其中,p 是事件成功的概率,q 是事件失败的概率。

案例:抛硬币游戏

考虑一个抛硬币的游戏,其中硬币是公平的,成功定义为正面朝上。每次抛硬币,我们用随机变量 X 来表示结果,其中 X=1 表示成功(正面朝上),X=0 表示失败(反面朝上)。成功的概率为 p=0.5,失败的概率为 q=0.5。这就是一个0-1分布的例子。

🍋二项分布(Binomial分布)

二项分布用于描述一系列独立重复的二元试验中成功次数的概率分布。它的概率质量函数如下:
P ( X = k ) = ( n k ) p k ( 1 − p ) n − k P(X = k) = \binom{n}{k} p^k (1-p)^{n-k} P(X=k)=(kn)pk(1p)nk

其中,n 是试验的总次数,k 是成功的次数,p 是每次试验成功的概率,(nk) 表示二项系数,计算方式为
C ( n , k ) = n ! k ! ( n − k ) ! C(n, k) = \frac{n!}{k!(n-k)!} C(n,k)=k!(nk)!n!

案例:硬币投掷次数

假设你要投掷一枚硬币10次,每次试验成功的概率是 p=0.3,即硬币正面朝上的概率为0.3。我们想知道正面朝上的次数 X。这个问题可以用二项分布来建模,其中 n=10(试验次数),p=0.3(每次试验成功的概率)。我们可以使用二项分布的公式来计算不同正面朝上次数的概率。

🍋泊松分布(Poisson分布)

泊松分布用于描述在一段时间或空间内随机事件发生的次数,通常用于描述低概率但高频率的事件,比如电话呼叫、事故发生等。其概率质量函数如下:
P ( X = k ) = e − λ λ k k ! P(X = k) = \frac{e^{-\lambda} \lambda^k}{k!} P(X=k)=k!eλλk
其中,λ 是事件发生的平均次数,k 是我们想要了解的特定次数。

案例:某网站的访问次数

假设某个网站平均每小时收到 5 次访问请求。我们想知道在某一小时内,该网站接收到 7 次访问请求的概率。这个问题可以用泊松分布来建模,其中 λ=5(平均每小时的访问次数),k=7(我们想要的特定次数)。我们可以使用泊松分布的公式来计算这一概率。

🍋几何分布(Geometric分布)

几何分布用于描述在一系列独立重复的二元试验中首次成功所需的试验次数。其概率质量函数如下:
P ( X = k ) = ( 1 − p ) k − 1 p P(X = k) = (1-p)^{k-1}p P(X=k)=(1p)k1p
其中,k 是首次成功的试验次数,p 是每次试验成功的概率。

案例:射击命中率

假设一名射手连续射击目标,每次射击成功的概率为 p=0.2,直到首次命中目标为止。我们想知道首次命中目标需要多少次射击。这个问题可以用几何分布来建模,其中 p=0.2(每次射击成功的概率)。我们可以使用几何分布的公式来计算首次命中所需的射击次数。

这些案例演示了如何应用0-1分布、二项分布、泊松分布和几何分布来描述不同类型的离散随机事件,并使用相应的概率质量函数来计算概率或期望值。这些分布在实际问题中具有广泛的应用,帮助我们理解和分析随机事件的概率性质。

🍋连续概率分布

🍋均匀分布(Uniform Distribution)

均匀分布表示在一个区间内的所有数值具有相等的概率密度。对于一个区间 [a,b],均匀分布的概率密度函数(PDF)如下: f ( x ) = { 1 b − a 如果  a ≤ x ≤ b 0 其他情况 f(x) = \begin{cases} \frac{1}{b-a} & \text{如果 } a \leq x \leq b \\ 0 & \text{其他情况} \end{cases} f(x)={ba10如果 axb其他情况
其中,a 和 b 是区间的上下界,f(x) 表示在区间内的概率密度。

案例:抽奖游戏

考虑一个抽奖游戏,参与者从一个数字范围 [a,b] 中随机抽取一个数字,其中 a=1,b=10。假设每个数字在范围内是等可能的,那么我们可以使用均匀分布来描述这个情景。在这种情况下,概率密度函数 f(x) 在区间 [1,10] 内的值都相等,为 1 10 \frac{1}{10} 101

🍋指数分布(Exponential Distribution)

指数分布通常用于描述等待时间或事件之间的时间间隔。其概率密度函数如下: f ( x ) = { λ e − λ x 如果  x ≥ 0 0 如果  x < 0 f(x) = \begin{cases} \lambda e^{-\lambda x} & \text{如果 } x \geq 0 \\ 0 & \text{如果 } x < 0 \end{cases} f(x)={λeλx0如果 x0如果 x<0
其中,λ 是事件发生率的倒数,x 是等待时间或时间间隔。

案例:设备故障时间

假设某台机器的故障时间服从指数分布,平均每小时发生一次故障,即 λ=1。我们想知道机器在两小时内不发生故障的概率。我们可以使用指数分布的概率密度函数来计算:

ruby

P ( X > 2 ) = ∫ 2 ∞ λ e − λ x d x P(X > 2) = \int_{2}^{\infty} \lambda e^{-\lambda x} dx P(X>2)=2λeλxdx

这个积分将告诉我们在两小时内不发生故障的概率。

🍋正态分布(Normal Distribution)

正态分布是自然界中许多现象的常见分布,具有钟形曲线形状。其概率密度函数如下: f ( x ) = 1 σ 2 π e − ( x − μ ) 2 2 σ 2 f(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} f(x)=σ2π 1e2σ2(xμ)2
其中,μ 是均值(分布的中心点),σ是标准差(分布的扩散程度)

案例:身高分布

假设我们研究一群成年男性的身高,该群体的平均身高为 μ=175 厘米,标准差为 σ=10 厘米。我们想知道身高在 [160,190] 厘米范围内的人口比例。我们可以使用正态分布的概率密度函数来计算:

P ( 160 ≤ X ≤ 190 ) = ∫ 160 190 1 10 2 π e − ( x − 175 ) 2 2 × 1 0 2 d x P(160 \leq X \leq 190) = \int_{160}^{190} \frac{1}{10\sqrt{2\pi}} e^{-\frac{(x-175)^2}{2\times10^2}} dx P(160X190)=160190102π 1e2×102(x175)2dx

这个积分将告诉我们在指定范围内的人口比例。
请添加图片描述

挑战与创造都是很痛苦的,但是很充实。

更多推荐

从统计语言模型到预训练语言模型---统计语言模型

语言模型从历史上来看,自然语言处理的研究范式变化是从规则到统计,从统计机器学习到基于神经网络的深度学习,这同时也是语言模型发展的历史。要了解语言模型的发展历史,首先我们需要认识什么是语言模型。语言模型的目标是建模自然语言的概率分布,即确定语言中任意词序列的概率,它提供了从概率统计角度建模语言文字的独特视角。语言模型在自

uniapp——实现电子签名功能——基础积累

话说,2020年刚来杭州的时候,有用到过uniapp,距今已有三年时间了,果然全忘了,哈哈[笑中带泪]昨天遇到一个需求:就是要实现pdf文件的预览,着实费了我很多的时间,连晚饭都没有吃好。。。这里写目录标题`先写一个小的功能点记录:文档预览功能的实现`——`openDocument``放弃web-view``放弃ifr

MySQL进阶篇2-索引的创建和使用

索引mkdirmysqltar-xvfmysqlxxxxx.tar-cmyqlcdmysqlrpm-ivh.....rpmyuminstallopenssl-develsystemctlstartmysqldgerp'temporarypassword'/var/log/mysqld.logmysql-uroot-pm

Python 06 之面向对象基础

😀前言在日常编程和软件开发中,我们通常会遇到各种各样的问题,其中很多问题都可以通过面向对象的程序设计方法来解决。面向对象编程不仅可以使代码更加组织化和系统化,而且还可以提高代码的重用性和可维护性。.在本教程中,我们将探索Python语言中面向对象编程的基本概念。我们将从最基本的类和对象的定义开始,然后深入探讨类的属性

【python百炼成魔】python之字典详解

前言今天我们一起来探讨python的另外一种类型:字典,如果你没有看过列表和元组,建议先学习列表和元组。【python百炼成魔】python之元组详解【python百炼成魔】python之列表详解文章目录前言字典的概念语法格式及字典的创建字典的日常操作1.获取字典的值2.获取字典视图的三个方法3.增加元素,修改元素,删

基于Java在线教学质量评价系统设计实现(源码+lw+部署文档+讲解等)

博主介绍:✌全网粉丝30W+,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌🍅文末获取源码联系🍅👇🏻精彩专栏推荐订阅👇🏻不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题

典型数据结构-栈/队列/链表、哈希查找、二叉树(BT)、线索二叉树、二叉排序树(BST树)、平衡二叉树(AVL树)、红黑树(RB树)

目录典型数据结构列举栈/队列/链表树二叉树线索二叉树二叉排序树平衡二叉树(AVL树)红黑树其它树种和应用介绍典型数据结构列举栈/队列/链表描述略。一些基本的简单实现参考/数据结构简单实现/文件夹里面。线性表详解:数据结构线性表10分钟入门(biancheng.net)。栈(Stack)和队列(Queue)详解(bian

EMQX Enterprise 5.2 发布:Flow 设计器,Amazon Kinesis,Azure Event Hubs

EMQXEnterprise5.2.0版本现已正式发布!新版本带来了一系列重磅更新,最令人瞩目的是可拖拽的可视化Flow设计器,它可以帮助企业快速创建、测试和部署数据集成。同时,我们新增了对AmazonKinesis和AzureEventHubs的支持,实现了海量物联网设备数据与云服务的无缝连接。此外,新版本还进行了多

【数据结构】堆的创建

💐🌸🌷🍀🌹🌻🌺🍁🍃🍂🌿🍄🍝🍛🍤📃个人主页:阿然成长日记👈点击可跳转📆个人专栏:🔹数据结构与算法🔹C语言进阶🚩不能则学,不知则问,耻于问人,决无长进🍭🍯🍎🍏🍊🍋🍒🍇🍉🍓🍑🍈🍌🍐🍍文章目录一、基于大堆的上下调整1.向上调整(1)解决措施:(2)代码实现

【小知识送书2】从不了解用户画像,到用画像数据赋能业务看这一本书就够了丨《用户画像:平台构建与业务实践》

⭐简单说两句⭐作者:后端小知识CSDN个人主页:后端小知识🔎GZH:后端小知识🎉欢迎关注🔎点赞👍收藏⭐️留言📝简单说两句🎁本次送书1~3本取决于阅读量,阅读量越多,送的越多😎欢迎大家在评论区留言,随机挑选幸运观众额,选中的幸运观众将会通过私信告知截止时间:2023-09-23引言在大数据时代,如何有效地挖

认识非托管动态链接库

一、非托管动态链接库1、非托管动态链接库(UnmanagedDynamicLinkLibrary,简称DLL)是一种包含可执行代码和数据的二进制文件,它被设计为在操作系统级别上执行。与托管代码不同,非托管DLL是使用原生机器代码编写的,并且不依赖于特定的运行时环境(如.NETFramework或.NETCore)。非托

热文推荐