-
ABTest灰度上线
我们都知道ABTest主要是围绕用户进行的实验,从统计意义上观察用户对不同的产品设计、交互体验、业务流程的反馈,从而指导产品的改进方向。那么很重要的一点就是如何进行分桶。与已知样本总量去切分比例不同,灰度上线时我们不知道用户总量会是多少,因此在线上如何实现具体的切分算法十分关键。一种错误做法通过UserID的尾数进行划分。这种设计只能进行单层实验,如果考虑长期交叉、连续的实验,这样做有很大的问题。 如果在同一分桶中同时进行了X和Y两个实验,那么实验结果就会相互干涉,结果变得不好解释。一种...…
-
排序算法
选择排序 首先在未排序序列中找到最小(大)元素,存放在排序序列的起始 再从剩余未排序元素中继续寻找最小(大)元素,然后放在已排序序列末尾 重复步骤2选择排序是遍历比较的,不同于冒泡法在每次比较后会交换元素位置,选择排序只记录本次遍历中最小(大)值角标。冒泡排序 比较相邻的元素,如果第一个比第二个大,就交换它们 对每一对相邻元素做同样工作,从开始一对至最后一对,这步做完后,最后的元素会是最大值 针对所有元素重复步骤2,除了最后一个元素 持续重复步骤2和3像鱼吐泡泡一样,每次由右...…
-
非暴力沟通
学习如何正确沟通是至关重要的,缺乏正确的沟通意识会给我们的生活带来很多不必要的麻烦,整理了一些书中觉得有意义的句子,摘录在这里。让爱融入生活 也许我们并不认为自己的谈话方式是“暴力”的,但我们的语言确实常常引发自己和他人的痛苦。 运用非暴力沟通聆听彼此心灵深处的需要,我们将以全新的眼光看待人际关系。 听到批评时,我们一般会申辩、退缩或反击。 当我们真诚助人时,我们丰富他人生命的愿望得到了满足。我们的行为,是出于由衷的喜悦。 非暴力沟通的四个要素:观察、感受、需要、请求。 观察:...…
-
机器学习杂记
杂记 机器学习致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。 机器学习所研究的内容,是关于在计算机上从数据中产生“模型”的算法,即“学习算法”。 学得模型适用于新样本的能力,称为泛化能力。 归纳和演绎是科学推理的两大基本手段。前者是从特殊到一般的泛化过程,即从具体事实归结出一般性规律;后者是从一般到特殊的特化过程,即从基础原理推演出具体状况。“从样本中学习”显然是一个归纳过程,因此亦称为“归纳学习”。归纳学习有广义与狭义之分,广义大体相当于从样本中学习;狭义则要求从样...…
-
使用PySimpleGUI编写多线程桌面应用
下面是一个使用PySimpleGUI编写桌面应用的小例子,底层是python自带的tkinter,代码是可以跨平台的。这是这个项目的文件树:├─utils/| ├─__init__.py| ├─db.py| └─tools.py├─app.py└─code.sql其中code.sql是我们的取数SQL模板,模板参数使用jinja2进行渲染;db.py文件,是另外一篇文章中写的数据库连接类;utils文件夹下的另一个文件tools.py内容如下:import base64from...…
-
贷后分析体系
# 贷后分析框架## 整体概况### 回款率达成- 即:监控实际达成与目标之间的差距### 分产品线逾期率- 按成交日计算- 按到期日计算### 案件质量- 即:通过模型分监控对后期回款情况的整体预测## 细分模块### 回款情况- 回款情况- 入催金额占比 - 即:回款率变动贡献度### 客群质量- 风险等级分布- 产品线分布- 多头等级分布- 新老案占比### 催员人力稳定性- 人力成熟度 - 即:工龄时长分布- 离职率 - 分成熟度 - 分模块### 催员行为指标- 人员负荷...…
-
使用python连接基于hadoop的数据库
使用python连接数据库时,频繁手写连接器使人心烦,因此将其包装为一个类,我们需要使用时只需调用它即可。import reimport loggingfrom time import timefrom abc import ABC, abstractmethodfrom impala.dbapi import connectfrom decorator import decorator__all__ = ["Impala", "Hive"]class LoggerFactory: ...…
-
浅尝爬虫技术
结构journey 什么是爬虫: 2 需要掌握哪些知识: 3 一个标准操作流程是什么: 4 小例子: 5什么是爬虫爬虫的定义非常宽泛,我理解的定义为:通过网络技术将需要的数据或文件从互联网上下载下来。实际上的爬虫就是一次次独立的网络访问,只不过访问发起者由浏览器或APP变成了编程软件。这里是知乎上的解释:爬虫能做什么 监控各地每日疫情数据的变化 利用爬虫整合各平台租房信息,并在本地使用elasticsearch检索筛选 Spring在去年开放了375本书的免费...…
-
wsl2的ip转发
win10中的wsl2与wsl1不同,2是一个纯正的虚拟机,因此如果我们在wsl2中搭建一个web应用,并想从别的设备访问的时候,使用本机的ip地址是访问不到的,因为wsl2中的ip地址与我们本机的ip地址是不一致的。win10的powershell自带了ip桥接命令,我们首先需要获得wsl2中的ip地址,在wsl2中运行下面的命令:ifconfig eth0结果如下图所示,其中红框内的ip为真正可以在本机访问wsl2内web应用的ip:接下来要做的,就是将wsl2的ip地址与端口桥接至本...…
-
使用R连接Impala
安装Impala Driver从官网下载并安装Impala DriverCodelibrary(implyr)library(odbc)impala <- src_impala( drv = odbc(), driver = 'Cloudera ODBC Driver for Impala', host = '', port = YOUR PORT, database = '', uid = '', pwd = '', authmech = 3, usessl = ...…