第三讲_逻辑回归

逻辑回归

逻辑回归是一个分类算法

对于分类问题的分类： - 二分类 - 多分类

逻辑回归是一个简单的二分类问题

分类和回归的区别： - 分类的结果取值只有两个 0 或 1 - 回归的结果取值可以是全体实数

可以有多个维度（特征），和线性回归类似

使用的是线性模型：

基础模型：

sigmoid function:也叫激活函数

def sigmoid(x):  # sigmoid函数
    return 1/(1+np.exp(-x))

def sigmoid_derivative(x): # sigmoid函数导数
    return x*(1-x)  # 这个也需要记一下

1 2	`def modlel_predict(x, theta): return sigmoid(np.dot(x, theta))`

Cross-entropy loss function: 交叉熵损失函数

\(y_i\) 等于 1 时激活 \(log(\hat{y_i})\) 值，\(y_i\) 等于 0 时激活 \(log(1-\hat{y_i})\)

代价函数如下：

计算梯度公式：

\(\frac{\partial L_i}{\partial W_i}=\frac{\partial L_i}{\partial \hat{y}}\frac{\partial \hat{y}}{\partial z} \frac{\partial z}{\partial W_i}=(\hat{y_i}-y_i)x_i\)
\(\frac{\partial L_i}{\partial b}=(\hat{y_i}-y_i)\)

更新公式：

\(W_i=W_i-\alpha\frac{\partial L}{\partial W_i}=W_i-\frac{\alpha}{n}\sum_{i=1}^{n}(\hat{y_i}-y_i)x_i\)
\(b=b-\alpha\frac{\partial L}{\partial b}=b-\frac{\alpha}{n}\sum_{i=1}^{n}(\hat{y_i}-y_i)\)