本次解析src/utils.h 与 src/utils.c 两个。主要涉及到了读写文件操作,以及字符串基本操作,
utils.h 中包含的代码如下:
#ifndef UTILS_H
#define UTILS_H
#include <stdio.h>
#include <time.h>
#include "darknet.h"
#include "list.h"
#define TIME(a) \
do { \
double start = what_time_is_it_now(); \
a; \
printf("%s took: %f seconds\n", #a, what_time_is_it_now() - start); \
} while (0)
#define TWO_PI 6.2831853071795864769252866f
double what_time_is_it_now(); //获得当前时间
void shuffle(void *arr, size_t n, size_t size); //对数组进行洗牌操作
void sorta_shuffle(void *arr, size_t n, size_t size, size_t sections); // 对每一个sections进行洗牌操作
void free_ptrs(void **ptrs, int n); // 释放二维指针的内存空间
int alphanum_to_int(char c); // 字符转整数
char int_to_alphanum(int i); //整数转字符
int read_int(int fd); // 从文件fd中读取一个整数
void write_int(int fd, int n); // 向文件fd中写入一个整数
void read_all(int fd, char *buffer, size_t bytes); // 将内存中buffer起始的bytes个字节数据写入到fd文件中,一次性操作,若写不完,则报错
void write_all(int fd, char *buffer, size_t bytes); // 从fd文件中,读取bytes个字节数据到内存中buffer起始,一次性操作,若读不完,则报错
int read_all_fail(int fd, char *buffer, size_t bytes); // 从fd文件中,读取bytes个字节数据到内存中buffer起始,直到读完;
int write_all_fail(int fd, char *buffer, size_t bytes); // 将内存中buffer起始的bytes个字节数据写入到fd文件中,直到写完
void find_replace(char *str, char *orig, char *rep, char *output);// 判断str中是否出现子串,若出现则进行替代;
void malloc_error(); // 报错,内存分配出错
void file_error(char *s); // 报错,不能打开指定目录的文件
void strip(char *s); // 过滤掉字符数组中' '和'\t'以及'\n'三种字符
void strip_char(char *s, char bad); //过滤掉字符数组存在的指定字符 bad
list *split_str(char *s, char delim);
char *fgetl(FILE *fp); // 读取指定文件中的一行字符;
list *parse_csv_line(char *line); // 字符串切割,按照指定字符delim进行切割;
char *copy_string(char *s); //字符串拷贝操作
int count_fields(char *line); // 统计字符数组中有多少个 空格字符和','字符;
float *parse_fields(char *line, int n); // // 解析字符数组中的float实数
void translate_array(float *a, int n, float s); // 对向量进行平移操作,
float constrain(float min, float max, float a); // 判断小数a 与 区间小数[min, max]的关系,返回相应的值
int constrain_int(int a, int min, int max); // 判断整数a 与 区间整数[min, max]的关系,返回相应的值
float rand_scale(float s); // 随机采用的基础上,50%的概率返回S,50%的概率返回1/s
int rand_int(int min, int max); // 返回一个区间[min, max]内的一个整数
void mean_arrays(float **a, int n, int els, float *avg); // 求二维float数组,每一列的平均值,保存在avg一维float数组中
float dist_array(float *a, float *b, int n, int sub); // 当sub为1的时候,其实就是计算两个一维数组的欧式距离
float **one_hot_encode(float *a, int n, int k); // 进行one_hot 编码,根据,float数组a中的元素进行编码
float sec(clock_t clocks); // 获取秒数
void print_statistics(float *a, int n); // 计算向量的mean和var
int int_index(int *a, int val, int n); // 一维数组进行查找操作,若查找指定值,返回index,否则,返回-1;
#endif
详细的注解,见utils.c:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <math.h>
#include <assert.h>
#include <unistd.h>
#include <float.h>
#include <limits.h>
#include <time.h>
#include <sys/time.h>
#include "utils.h"
/*
// old timing. is it better? who knows!!
double get_wall_time()
{
struct timeval time;
if (gettimeofday(&time,NULL)){
return 0;
}
return (double)time.tv_sec + (double)time.tv_usec * .000001;
}
*/
// 获得当前时间,到秒的时间戳,并对微秒进行四舍五入。
// tv_usrc 获取到微秒,需要10^-6转换为秒
double what_time_is_it_now()
{
//
struct timeval time;
if (gettimeofday(&time,NULL)){
return 0;
}
return (double)time.tv_sec + (double)time.tv_usec * .000001;
}
// 读取初始gpu_list,获得gpu id编号
int *read_intlist(char *gpu_list, int *ngpus, int d)
{
int *gpus = 0;
// 如果gpu_list不为空,gpu_list = "*,*,*,*,"
if(gpu_list){
int len = strlen(gpu_list);
*ngpus = 1;
int i;
// 通过计数","的个数来统计gpu的个数
for(i = 0; i < len; ++i){
if (gpu_list[i] == ',') ++*ngpus;
}
// 分配存储空间
gpus = calloc(*ngpus, sizeof(int));
// 将GPU编号保存到 gpus int型数组中
for(i = 0; i < *ngpus; ++i){
//将gpu_list前面的字符转换成整数,atoi碰到不能转换的符号,停止转换,例: "123.45" 转换结果 "123"; "123,45" 转换结果 "123"
gpus[i] = atoi(gpu_list);
// 更新gpu_list,已经保存到gpus中要过滤掉, strchr 查找某字符的index,返回从该index开始的子字符数组;
gpu_list = strchr(gpu_list, ',')+1;
}
} else {// gpu_list 为空,
gpus = calloc(1, sizeof(float));
*gpus = d; // 指定编号d的gpu
*ngpus = 1;
}
return gpus; // 返回的gpus 可能是一个int数组,也有可能是一个int整数,具体看gpu_list
}
// 读取指定文件中,每一行的最开始的整数,保存到一维数组中,数组长度为文件的有效行数。
int *read_map(char *filename)
{
int n = 0;
int *map = 0;
char *str;
FILE *file = fopen(filename, "r");
if(!file) file_error(filename); // 未成功读取文件,报错
while((str=fgetl(file))){ //逐行读取
++n;
map = realloc(map, n*sizeof(int));
map[n-1] = atoi(str); // 根据此语句可以得知,在file 每一行的开始处读取一个整数,保存到 map数组的末尾;
}
return map;
}
// 对每一个sections进行洗牌操作
void sorta_shuffle(void *arr, size_t n, size_t size, size_t sections)
{
size_t i;
for(i = 0; i < sections; ++i){
size_t start = n*i/sections;
size_t end = n*(i+1)/sections;
size_t num = end-start;
shuffle(arr+(start*size), num, size);
}
}
// 对数组进行洗牌操作
void shuffle(void *arr, size_t n, size_t size)
{
size_t i;
void *swp = calloc(1, size); //分配一个1个长度为size的连续空间
for(i = 0; i < n-1; ++i){
size_t j = i + rand()/(RAND_MAX / (n-i)+1); //进行洗牌操作
memcpy(swp, arr+(j*size), size);
memcpy(arr+(j*size), arr+(i*size), size);
memcpy(arr+(i*size), swp, size);
}
}
// index 洗牌操作
int *random_index_order(int min, int max)
{
int *inds = calloc(max-min, sizeof(int)); // 申请存储空间
int i;
for(i = min; i < max; ++i){ // 初始化
inds[i] = i;
}
for(i = min; i < max-1; ++i){ // 洗牌操作
int swap = inds[i];
int index = i + rand()%(max-i);
inds[i] = inds[index];
inds[index] = swap;
}
return inds;
}
// 从第index+1开始,将argv元素向左移动,最后一个元素置null
void del_arg(int argc, char **argv, int index)
{
int i;
for(i = index; i < argc-1; ++i) argv[i] = argv[i+1];
argv[i] = 0;
}
// 删除指定字符串 arg,其后面的字符串往左移动
int find_arg(int argc, char* argv[], char *arg)
{
int i;
for(i = 0; i < argc; ++i) {
if(!argv[i]) continue;
if(0==strcmp(argv[i], arg)) {
del_arg(argc, argv, i);
return 1;
}
}
return 0;
}
// 找到指定 arg, 后面的参数往左一定两个位置
int find_int_arg(int argc, char **argv, char *arg, int def)
{
int i;
for(i = 0; i < argc-1; ++i){
if(!argv[i]) continue;
if(0==strcmp(argv[i], arg)){
def = atoi(argv[i+1]);
del_arg(argc, argv, i);
del_arg(argc, argv, i);
break;
}
}
return def;
}
// 同理
float find_float_arg(int argc, char **argv, char *arg, float def)
{
int i;
for(i = 0; i < argc-1; ++i){
if(!argv[i]) continue;
if(0==strcmp(argv[i], arg)){
def = atof(argv[i+1]);
del_arg(argc, argv, i);
del_arg(argc, argv, i);
break;
}
}
return def;
}
// 同理
char *find_char_arg(int argc, char **argv, char *arg, char *def)
{
int i;
for(i = 0; i < argc-1; ++i){
if(!argv[i]) continue;
if(0==strcmp(argv[i], arg)){
def = argv[i+1];
del_arg(argc, argv, i);
del_arg(argc, argv, i);
break;
}
}
return def;
}
// 提取cfg文件的文件名,
char *basecfg(char *cfgfile)
{
char *c = cfgfile;
char *next;
// 查找到最后一个 '/', 只要最后一个'/'后面的内容
while((next = strchr(c, '/')))
{
c = next+1;
}
c = copy_string(c); // 重新分配一块内存进行存储
next = strchr(c, '.'); //查找后缀
if (next) *next = 0; //后面置null
return c;
}
// 字符转整数
int alphanum_to_int(char c)
{
return (c < 58) ? c - 48 : c-87;
}
// 整数转字符
char int_to_alphanum(int i)
{
if (i == 36) return '.';
return (i < 10) ? i + 48 : i + 87;
}
// 可视化一维float数组,M×N列
void pm(int M, int N, float *A)
{
int i,j;
for(i =0 ; i < M; ++i){
printf("%d ", i+1);
for(j = 0; j < N; ++j){
printf("%2.4f, ", A[i*N+j]);
}
printf("\n");
}
printf("\n");
}
// 判断str中是否出现子串,若出现则进行替代;
void find_replace(char *str, char *orig, char *rep, char *output)
{
char buffer[4096] = {0};
char *p;
sprintf(buffer, "%s", str);
if(!(p = strstr(buffer, orig))){ // Is 'orig' even in 'str'? // 判断orig是否是buffer的子串,若是返回orig在buffer的起始地址,否则返回null
sprintf(output, "%s", str);
return;
}
*p = '\0'; // 因为sprintf拼接必须是'\0'结尾的字符数组;
sprintf(output, "%s%s%s", buffer, rep, p+strlen(orig)); // 拼接,用rep 替代 buffer中的orig部分,其余不变,如: str = "1qaz", rep = "3344", orig = "qa"; output = "1q" + '\0' + "3344"+"z"
}
// 获取秒数
float sec(clock_t clocks)
{
return (float)clocks/CLOCKS_PER_SEC;
}
// 返回float数组a中top-k,index数组保存从 top-k的角标;
void top_k(float *a, int n, int k, int *index)
{
int i,j;
for(j = 0; j < k; ++j) index[j] = -1; // index数组初始化,全部置为-1, 长度k
for(i = 0; i < n; ++i){
int curr = i;
for(j = 0; j < k; ++j){
if((index[j] < 0) || a[curr] > a[index[j]]){ // 交换两者index
int swap = curr;
curr = index[j];
index[j] = swap;
}
}
}
}
void error(const char *s)
{
perror(s); // perror()函数先打印字符数组 s ,然后打印出错的原因
assert(0); // 报错
exit(-1);
}
// 将一个文件中的内容,一次性读取完;
unsigned char *read_file(char *filename)
{
FILE *fp = fopen(filename, "rb");
size_t size;
fseek(fp, 0, SEEK_END); //将fp流指针移动到文件结尾;
size = ftell(fp); //获取文件长度
fseek(fp, 0, SEEK_SET); // 将fp流指针移动文件开头
unsigned char *text = calloc(size+1, sizeof(char)); // 申请存储空间
fread(text, 1, size, fp); // 1表示每个数据项的字节数,size表示要读的数据项个数,fp流指针,text内存地址
fclose(fp);
return text;
}
// 报错,内存分配出错
void malloc_error()
{
fprintf(stderr, "Malloc error\n");
exit(-1);
}
// 报错,不能打开指定目录的文件
void file_error(char *s)
{
fprintf(stderr, "Couldn't open file: %s\n", s);
exit(0); //程序运行正常退出
}
// 字符串切割,按照指定字符delim进行切割;
list *split_str(char *s, char delim)
{
size_t i;
size_t len = strlen(s);
list *l = make_list();
list_insert(l, s);
for(i = 0; i < len; ++i){
if(s[i] == delim){
s[i] = '\0';
list_insert(l, &(s[i+1]));
}
}
return l;
}
// 过滤掉字符数组存在的 ' ' 和 '\t' 以及 '\n' 三种字符
void strip(char *s)
{
size_t i;
size_t len = strlen(s);
size_t offset = 0;
for(i = 0; i < len; ++i){
char c = s[i];
if(c==' '||c=='\t'||c=='\n') ++offset;
else s[i-offset] = c;
}
s[len-offset] = '\0';
}
// 过滤掉字符数组存在的指定字符 bad
void strip_char(char *s, char bad)
{
size_t i;
size_t len = strlen(s);
size_t offset = 0;
for(i = 0; i < len; ++i){
char c = s[i];
if(c==bad) ++offset;
else s[i-offset] = c;
}
s[len-offset] = '\0';
}
// 释放二维指针的内存空间
void free_ptrs(void **ptrs, int n)
{
int i;
for(i = 0; i < n; ++i) free(ptrs[i]);
free(ptrs);
}
// 读取指定文件中的一行字符;
char *fgetl(FILE *fp)
{
if(feof(fp)) return 0; // feof()检测流文件指针是否已到文件结尾。文件读取结束,返回非0,否则返回0.
size_t size = 512;
char *line = malloc(size*sizeof(char)); // 申请512个字符空间
if(!fgets(line, size, fp)){ //fgets 读取文件中一行的数据,存放到line中.读取失败或读取到换行符或读取到文件末尾返回,读取fgets失败返回null
free(line);
return 0;
}
size_t curr = strlen(line);
// 读取未满一行时
while((line[curr-1] != '\n') && !feof(fp)){
if(curr == size-1){ // 扩充
size *= 2;
line = realloc(line, size*sizeof(char));
if(!line) {
printf("%ld\n", size);
malloc_error();
}
}
size_t readsize = size-curr;
if(readsize > INT_MAX) readsize = INT_MAX-1; // 不能超过INTMAX,上溢
fgets(&line[curr], readsize, fp); // 读取其余部分
curr = strlen(line);
}
if(line[curr-1] == '\n') line[curr-1] = '\0'; // index n-1处为'\n'表示读完了一行,将其修改为'\0',因为字符数组默认结果为'\0',需手动补上
return line;
}
// 从文件fd中读取一个整数
int read_int(int fd)
{
int n = 0;
int next = read(fd, &n, sizeof(int)); // next为成功读取的字节数,如果为-1,则表示读取失败,若调read之前已经到达文件末尾,则这次read返回0.
if(next <= 0) return -1;
return n;
}
// 向文件fd中写入一个整数
void write_int(int fd, int n)
{
int next = write(fd, &n, sizeof(int));
if(next <= 0) error("read failed");
}
// 从fd文件中,读取bytes个字节数据到内存中buffer起始,直到读完;
int read_all_fail(int fd, char *buffer, size_t bytes)
{
size_t n = 0;
while(n < bytes){
int next = read(fd, buffer + n, bytes-n);
if(next <= 0) return 1;
n += next;
}
return 0;
}
// 将内存中buffer起始的bytes个字节数据写入到fd文件中,直到写完
int write_all_fail(int fd, char *buffer, size_t bytes)
{
size_t n = 0;
while(n < bytes){
size_t next = write(fd, buffer + n, bytes-n); // 将buffer+n 所指向的内存写入bytes-n个字节到fd文件中;
if(next <= 0) return 1; //如果写入成功,会返回写入的字节数,即返回 bytes,否则,返回-1【写入失败】;
n += next; // n变成 n+bytes,
} // while 循环这么去写,可以保证全部bytes字节数写入到文件fd中
return 0;
}
// 将内存中buffer起始的bytes个字节数据写入到fd文件中,一次性操作,若写不完,则报错
void read_all(int fd, char *buffer, size_t bytes)
{
size_t n = 0;
while(n < bytes){
int next = read(fd, buffer + n, bytes-n);
if(next <= 0) error("read failed");
n += next;
}
}
// 从fd文件中,读取bytes个字节数据到内存中buffer起始,一次性操作,若读不完,则报错
void write_all(int fd, char *buffer, size_t bytes)
{
size_t n = 0;
while(n < bytes){
size_t next = write(fd, buffer + n, bytes-n);
if(next <= 0) error("write failed");
n += next;
}
}
// 字符数组的复制操作
char *copy_string(char *s)
{
char *copy = malloc(strlen(s)+1);
strncpy(copy, s, strlen(s)+1); //将以s地址开始的前strlen(s) + 1 个字节复制到copy所指向的数组中
return copy;
}
// 解析某种特定格式,如: "******, "222,"32242, "342423
list *parse_csv_line(char *line)
{
list *l = make_list(); // 链表初始化
char *c, *p;
int in = 0;
// 遍历字符数组line
for(c = line, p = line; *c != '\0'; ++c){
if(*c == '"') in = !in; // 遇到 " 字符,则in=1
else if(*c == ',' && !in){
*c = '\0';
list_insert(l, copy_string(p)); // 链表中元素的是一个字符数组,并且 包含 " 字符, 遇到','结束
p = c+1;
}
}
// 插入剩下的部分
list_insert(l, copy_string(p));
return l;
}
// 统计字符数组中有多少个 空格字符和','字符;
int count_fields(char *line)
{
int count = 0;
int done = 0;
char *c;
for(c = line; !done; ++c){
done = (*c == '\0');
if(*c == ',' || done) ++count;
}
return count;
}
// 解析字符数组中的float实数
float *parse_fields(char *line, int n)
{
float *field = calloc(n, sizeof(float)); // 申请n个float存储空间
char *c, *p, *end;
int count = 0;
int done = 0;
for(c = line, p = line; !done; ++c){
done = (*c == '\0');
if(*c == ',' || done){
*c = '\0';
field[count] = strtod(p, &end); //strtod将字符串转换为float类型 ,会过滤遇到的空格字符,直到遇到数字或者+/- 才开始转换,到出现非数字或者字符串结束符'\0'结束;end,
if(p == c) field[count] = nan(""); // 转换数字开始位置指针p 和 工作指针c指向同一地址,表明,一开始就遇到','或者'\0',肯定不合理,使用nan函数
// 如果转换合理,应该end和c指向同一位置,end表示余下未转换的起始位置,c为当前工作位置;
if(end != c && (end != c-1 || *end != '\r')) field[count] = nan(""); //DOS file formats!
p = c+1;
++count;
}
}
return field;
}
// 对float一维数组求和
float sum_array(float *a, int n)
{
int i;
float sum = 0;
for(i = 0; i < n; ++i) sum += a[i];
return sum;
}
// 对float一维数组求均值
float mean_array(float *a, int n)
{
return sum_array(a,n)/n;
}
// 求二维float数组,每一列的平均值,保存在avg一维float数组中
void mean_arrays(float **a, int n, int els, float *avg)
{
int i;
int j;
memset(avg, 0, els*sizeof(float));// 申请els个float存储空间
for(j = 0; j < n; ++j){
for(i = 0; i < els; ++i){
avg[i] += a[j][i]; // 计算每列元素之和,共els列
}
}
for(i = 0; i < els; ++i){
avg[i] /= n; // avg中保存是每一列的平均值
}
}
// 计算向量的mean和var
void print_statistics(float *a, int n)
{
float m = mean_array(a, n);
float v = variance_array(a, n);
printf("MSE: %.6f, Mean: %.6f, Variance: %.6f\n", mse_array(a, n), m, v);
}
// 对float一维数组求方差
float variance_array(float *a, int n)
{
int i;
float sum = 0;
float mean = mean_array(a, n); // 求平均值
// 求方差
for(i = 0; i < n; ++i) sum += (a[i] - mean)*(a[i]-mean);
float variance = sum/n;
return variance;
}
// 判断整数a 与 区间整数[min, max]的关系,返回相应的值
int constrain_int(int a, int min, int max)
{
if (a < min) return min;
if (a > max) return max;
return a;
}
// 判断小数a 与 区间小数[min, max]的关系,返回相应的值
float constrain(float min, float max, float a)
{
if (a < min) return min;
if (a > max) return max;
return a;
}
// 当sub为1的时候,其实就是计算两个一维数组的欧式距离
float dist_array(float *a, float *b, int n, int sub)
{
int i;
float sum = 0;
for(i = 0; i < n; i += sub) sum += pow(a[i]-b[i], 2);
return sqrt(sum);
}
// 向量的模长除以N
float mse_array(float *a, int n)
{
int i;
float sum = 0;
for(i = 0; i < n; ++i) sum += a[i]*a[i];
return sqrt(sum/n);
}
// 归一化操作,
void normalize_array(float *a, int n)
{
int i;
float mu = mean_array(a,n);
float sigma = sqrt(variance_array(a,n));
for(i = 0; i < n; ++i){
a[i] = (a[i] - mu)/sigma;
}
mu = mean_array(a,n);
sigma = sqrt(variance_array(a,n));
}
// 对向量进行平移操作,
void translate_array(float *a, int n, float s)
{
int i;
for(i = 0; i < n; ++i){
a[i] += s;
}
}
// 求向量a的模长
float mag_array(float *a, int n)
{
int i;
float sum = 0;
for(i = 0; i < n; ++i){
sum += a[i]*a[i];
}
return sqrt(sum);
}
// 向量的与实数的乘法
void scale_array(float *a, int n, float s)
{
int i;
for(i = 0; i < n; ++i){
a[i] *= s;
}
}
// 感觉就是从向量中采用一个数,返回其index
int sample_array(float *a, int n)
{
float sum = sum_array(a, n);
scale_array(a, n, 1./sum); // 对向量进行单位化(不知道这么叫对不对)
float r = rand_uniform(0, 1); // 产生一个[0,1]的随机数
int i;
for(i = 0; i < n; ++i){
r = r - a[i];
if (r <= 0) return i; // 找到第一个小于0的数
}
return n-1;
}
// 一维int数组找最大值操作,若找到最大值,返回index,否则,返回-1;
int max_int_index(int *a, int n)
{
if(n <= 0) return -1;
int i, max_i = 0;
int max = a[0];
for(i = 1; i < n; ++i){
if(a[i] > max){
max = a[i];
max_i = i;
}
}
return max_i;
}
// 一维float数组找最大值操作,若找到最大值,返回index,否则,返回-1;
int max_index(float *a, int n)
{
if(n <= 0) return -1;
int i, max_i = 0;
float max = a[0];
for(i = 1; i < n; ++i){
if(a[i] > max){
max = a[i];
max_i = i;
}
}
return max_i;
}
// 一维数组进行查找操作,若查找指定值,返回index,否则,返回-1;
int int_index(int *a, int val, int n)
{
int i;
for(i = 0; i < n; ++i){
if(a[i] == val) return i;
}
return -1;
}
// 返回一个区间[min, max]内的一个整数
int rand_int(int min, int max)
{
if (max < min){
int s = min;
min = max;
max = s;
}
int r = (rand()%(max - min + 1)) + min;
return r;
}
// From http://en.wikipedia.org/wiki/Box%E2%80%93Muller_transform
// 标准正太分布
float rand_normal()
{
static int haveSpare = 0;
static double rand1, rand2;
if(haveSpare)
{
haveSpare = 0;
return sqrt(rand1) * sin(rand2);
}
haveSpare = 1;
// 获取区间[0,1]内的一个随机数
rand1 = rand() / ((double) RAND_MAX);
// 不能太小
if(rand1 < 1e-100) rand1 = 1e-100;
rand1 = -2 * log(rand1);
rand2 = (rand() / ((double) RAND_MAX)) * TWO_PI;
return sqrt(rand1) * cos(rand2);
}
/*
float rand_normal()
{
int n = 12;
int i;
float sum= 0;
for(i = 0; i < n; ++i) sum += (float)rand()/RAND_MAX;
return sum-n/2.;
}
*/
size_t rand_size_t()
{
return ((size_t)(rand()&0xff) << 56) |
((size_t)(rand()&0xff) << 48) |
((size_t)(rand()&0xff) << 40) |
((size_t)(rand()&0xff) << 32) |
((size_t)(rand()&0xff) << 24) |
((size_t)(rand()&0xff) << 16) |
((size_t)(rand()&0xff) << 8) |
((size_t)(rand()&0xff) << 0);
}
// 进行随机采样操作,从区间[min, max]随机返回一个实数
float rand_uniform(float min, float max)
{
if(max < min){
float swap = min;
min = max;
max = swap;
}
return ((float)rand()/RAND_MAX * (max - min)) + min;
}
// 随机采用的基础上,50%的概率返回S,50%的概率返回1/s
float rand_scale(float s)
{
float scale = rand_uniform(1, s);
if(rand()%2) return scale;
return 1./scale;
}
// 进行one_hot 编码,根据,float数组a中的元素进行编码
float **one_hot_encode(float *a, int n, int k)
{
int i;
float **t = calloc(n, sizeof(float*)); // 申请n个float * 指针存储空间
for(i = 0; i < n; ++i){
t[i] = calloc(k, sizeof(float)); // 每个t中的元素为一个float 指针,指向k个float
int index = (int)a[i]; // 丢掉小数部分
t[i][index] = 1; //第index 置为1
}
return t;
}