冬奧會(huì)開幕式上的大雪花有一片片小雪花銘牌組成,這也是藏在雪花晶體中的秘密,請讓我們一起深入地聊一聊雪花的細(xì)微結(jié)構(gòu)吧!
雪花是什么形狀呢?
落在衣袖上尚可觀察一番,但若落在手心,恐怕很快就會(huì)融化了。北方的鵝毛大雪相較于北方的零星點(diǎn)點(diǎn),更加容易觀察,穿著厚厚的棉衣,帶著個(gè)放大鏡,就能觀察到雪花晶體,而且天氣越冷越清晰,像深夜里一顆顆耀眼的小星星,閃閃發(fā)光。
不過,大家要注意一下,雪花可不是五角星,而是六角的,至于為什么是六,一會(huì)兒我們就會(huì)說到了。
有些北方的小伙伴,可能還會(huì)在寒冷的冬季,見過冰窗花,十分的瑰麗動(dòng)人,就像是結(jié)冰而成的羽毛或樹枝的形狀。
說到這,突然想起來一個(gè)有趣的小問題,冬天玻璃窗上形成的冰窗花,一般是在窗戶的哪一側(cè)呢?
不知道看推文的小伙伴們中有幾個(gè)能答對。
? 答案:B. 當(dāng)室內(nèi)外溫差很大,而且室內(nèi)的濕度又比較大的情況下,靠近玻璃窗的那些水蒸氣,就會(huì)凝結(jié)成固體的水冰晶,依附在玻璃窗上。 ?
如果你在清晨起床時(shí),看到了玻璃窗上的冰窗花,忍不住想用手觸摸一下的話,大概冰窗花就會(huì)被你糊掉,消失不見了,正所謂“愛她,就要給他自由”,不然你的采摘,可能會(huì)讓花朵枯萎。
當(dāng)然,還有個(gè)要求,就是室內(nèi)和室外的溫度都要低于零度才可以,現(xiàn)如今,北方基本上家家戶戶都有暖氣,屋外寒風(fēng)暴雪,屋內(nèi)穿著短袖吃雪糕,所以估摸著年齡比較小的小伙伴可能沒怎么見過冰窗花。
為什么要提到冰窗花呢,因?yàn)閺木w結(jié)構(gòu)來看,冰窗花和雪花具有相同的形狀。
? 在顯微鏡下,雪花都是美的奇跡。如果這種美無人能看到或是欣賞到簡直就是遺憾。——威爾遜本特利 ?
這是美國佛蒙特州一個(gè)偏遠(yuǎn)小鎮(zhèn)上的農(nóng)民威爾遜本特利在一個(gè)世紀(jì)之前記錄下來的雪花晶體影像。可以說,威爾遜時(shí)世界上第一位用相機(jī)記錄雪花晶體地人。
「雪花,形如其名,也是一種綻開的花朵,有著攝人心魄的美麗。」
許多科學(xué)家是雪花的超級大粉絲,比如德國物理學(xué)家約翰尼斯開普勒,加州理工學(xué)院的物理學(xué)家肯尼思·利布萊希特教授等,都曾為雪花著書立傳。
雪花,就像一枚潔凈的水晶制成品,六支根部相連,「有序與無序」、「有意與無意」、「確定與不確定」統(tǒng)統(tǒng)混雜在一起,雖然有規(guī)律可循,但也沒有一個(gè)專門描述這種晶體形狀的名稱,于是乎,只好用她的名字為這種形狀命名,「雪花狀」。
作為世界未解之謎之一的「麥田怪圈」,就出現(xiàn)過類似雪花狀的。
然而,即使在這個(gè)大數(shù)據(jù)時(shí)代,我們可以通過電子設(shè)備分辨雪花的上百上千種細(xì)微特征,雪花恐怕也會(huì)有億億種不同的形狀,但在我看來,我覺得找到完全相同的兩片雪花是不可能的。「美國《國家地理》」 有一篇文章也曾表示過相同的觀點(diǎn)。
作為一名統(tǒng)計(jì)學(xué)研究者,難免習(xí)慣性地從統(tǒng)計(jì)學(xué)角度來看,因?yàn)槭澜缡亲兓模晕覀兯f的一切概率都是有條件的,那么,出現(xiàn)完全相同的兩片雪花怎么可能呢?
不過 「《生命科學(xué)》(Live Science)」 上有一篇文章卻說雪花是可能重復(fù)的,甚至有人宣布發(fā)現(xiàn)了兩個(gè)完全一樣的雪花。
正所謂仁者見仁,智者見智,至少我很認(rèn)同:
? 古希臘哲學(xué)家赫拉克利特說的那句:人不可能兩次踏進(jìn)同一條河流。 ?
而且,倉央嘉措也說過“同一朵花會(huì)有不同的模樣”。
關(guān)于雪花的是六方對稱的說法已經(jīng)存在了數(shù)千年,不過對雪花正式的研究,還是從開普勒1611年的《On the Six-Cornered Snowflack》(論六角形雪花)開始。
這里說個(gè)小八卦,大家有沒有看到書皮上倒數(shù)第二行的小字“A New Year's Gift”。這本書是作為一份兒新年禮物問世的?是的,沒錯(cuò),這是開普勒送給羅馬皇帝魯?shù)婪蚨赖模吘惯@是開普勒的老板嘛。
? 「On the Six-Cornered Snowflack」 雪花在飄落之初的形狀是小小的六角形,這肯定是有原因的。如果只是偶然,為什么他們不是五角形或者七角型呢?只要所有雪花一直相互分離,只要他們沒有在飄落過程中受到擠壓,他們就會(huì)一直是六角形,這是為什么呢? ?
「“由于物質(zhì)的基本特性,六角形脫穎而出,這種形狀不僅可以保證不留空隙,還有利于水蒸氣更加平穩(wěn)地聚集并形成雪花”——開普勒」
「之所以是六」,還是因?yàn)榱呅蔚蔫偳缎Ч浅:茫鶄€(gè)等邊三角形,共用一個(gè)頂點(diǎn),保證每個(gè)頂點(diǎn)的角度(60度)不留空隙,正好契合(360度),也不重疊。
而且,六還是個(gè)完美數(shù),怪不得小編自小最喜歡的數(shù)字就是6呢,原來如此。
不信,我們一起來看,6 的因子有1、2、3,這三個(gè)因子相加又恰好等于他本身,
除此,6 在數(shù)學(xué)中也是個(gè)很特別的存在,他是二維空間中的 「親吻數(shù)」。
? 親吻數(shù)定義: 在 維空間中,最多有多少個(gè) 維單位平面可以“親吻”(接觸)某一單位平面。 ?
也就是說,在二維空間里,如果假設(shè)有一個(gè)直徑為 1cm 的圓,那么這個(gè)圓周圍最多可以有6個(gè)直徑為 1cm 的圓和它接觸到。
<<< 左右滑動(dòng)見更多 >>>
從平面結(jié)構(gòu)來看,雪花晶體的結(jié)構(gòu)是勻稱的。
我們來看這個(gè)六邊形對稱的雪花,「當(dāng)旋轉(zhuǎn)任何角度:60度,120度,180度,240度,300度和360度」,人們不會(huì)意識到發(fā)生任何變化:同樣的形狀,完全一樣的地方,這就是「零度旋轉(zhuǎn)」。
零度下才可以誕生的雪花,滿足零度旋轉(zhuǎn),說起來還真是很有意思。
當(dāng)然,像這類對稱性,我們其實(shí)在生活中見過許多。比如小時(shí)候,小伙伴們經(jīng)常會(huì)做一種游戲,往小河中拋石子,看誰拋的遠(yuǎn)或者激起更大的漣漪。
一棵石子落入水中,或者一滴水滴落在平靜的水面,蕩漾起的波紋就是一圈圈的同心圓,「這種就是圓對稱性,也即是在各個(gè)方向上的傳播速度是相同的」。
雪花下落過程中,會(huì)環(huán)繞中心的對稱點(diǎn)不停地旋轉(zhuǎn)振動(dòng),這時(shí)候,雪花的每一個(gè)邊就處于完全相同的空氣環(huán)境中啦,這就使得雪花在形成過程中始終是對稱的。有時(shí)候,兩朵雪花會(huì)在空中相遇,然后產(chǎn)生新的結(jié)晶,雖然此時(shí)雪花花瓣超過6個(gè),但若剛好達(dá)到12,那么就依然是對稱的。
雪花,真真切切的是個(gè)三維晶體結(jié)構(gòu),我們不能只停留在二維。三維的對稱有著新的組合方式。
對啦,有沒有人想過,為什么雨滴是球體呢?哈哈,因?yàn)橛甑螇嬄涞臅r(shí)候希望阻力最小,也就是保持表面積最小,「當(dāng)體積一定的時(shí)候,體積最小的自然就是球體啦」。
這是大自然中蘊(yùn)含的規(guī)律。類似的球體,還有地球,因?yàn)榈厍蛟缙谛纬傻臅r(shí)候,在軌道上繞太陽旋轉(zhuǎn),就如同雨滴在空中自由下落,打磨之下,也產(chǎn)生了球體。
之前很好奇,為什么那么多實(shí)際場景中用到「高斯分布」,又為什么「高斯分布是已知均值方差情況下包含信息量最大的分布」呢,是不是因?yàn)樯系厶貏e鐘愛「圓形」?
如果畫一個(gè)二維高斯分布的散點(diǎn)圖,那自然會(huì)得到一個(gè)圓形,或圓的更一般形式橢圓,
多維高斯分布對應(yīng)的就是超球體了,這也是大自然的手筆吧。
下面要說點(diǎn)兒化學(xué)了,「雪花的本質(zhì)是水分子,也就是結(jié)晶水 」。水分子是個(gè)四面體,中心為氧原子,四面體的四個(gè)頂點(diǎn)中,有兩個(gè)是氫原子,另外兩個(gè)是空置的。冰晶就是這些水分子按照一定的規(guī)律疊加在一起。
雪冰晶是水在“正常”溫度和壓力下形成的,近似為「六邊形棱柱層疊而成」,有些像蜂巢,一根根六邊形通道的樣子,晶體的側(cè)邊非常平坦,所以我們才有了「滑冰」這項(xiàng)運(yùn)動(dòng),因?yàn)槠教箷r(shí)容易滑動(dòng)呀。
什么是分形呢?
這其實(shí)是一位IBM的科學(xué)家伯努瓦曼德勃羅提出來的,他的研究工作看似無關(guān),卻有著一個(gè)共同點(diǎn),無論是股票市場、河流水量還是電子線路等,都有一個(gè)復(fù)雜精細(xì)的結(jié)構(gòu),無論你把它放大還是縮小,仍然可以觀察到,這就是分形。
比如大自然中的樹木,總的來看,有根部、樹干、樹枝和樹葉,但是仔細(xì)看一片樹葉,仍然脈絡(luò)清晰,而且再繼續(xù)看下去,復(fù)雜和精細(xì)程度也不亞于一棵樹。再比如,巖石,看起來仿佛是一座山的縮影。
雪花也是如此,不過規(guī)律性更強(qiáng)一些,從水分子開始,先形成六邊形,然后以其為中心伸展。
在冰晶生長過程中,水分子在其表面不斷積聚,如果在平整的表面上形成小鼓包,那應(yīng)該不會(huì)太長久,足夠大之后就會(huì)變得不穩(wěn)定,然后分裂,形成更多的小鼓包。有點(diǎn)像春天發(fā)芽的嫩枝,通過尖端的不斷分裂,得到生長,最后得到一個(gè)樹狀結(jié)構(gòu)。
「海里格·馮·科赫 (Helge von Koch)」 發(fā)表了一篇論文“關(guān)于一個(gè)可由基本幾何方法構(gòu)造出的無切線的連續(xù)曲線”,描述了科赫曲線的構(gòu)造方法。這是最早被描述出來的分形曲線之一,也就是著名的「科赫雪花 (Koch snowflake)」。
來源于大自然,也要回饋于世界,如今,分形可是廣泛應(yīng)用在人工智能領(lǐng)域的。
參考文獻(xiàn):
1. 雪花里的數(shù)學(xué), 蔣迅, 《數(shù)學(xué)文化》, 2012年第4期 (總第12期).
科學(xué)網(wǎng)-雪花里的數(shù)學(xué):一,雪花研究史 - 蔣迅的博文
2. 雪花中的數(shù)學(xué)美——每一片雪花都有不同的故事
雪花中的數(shù)學(xué)美--每一片雪花都有不同的故事
3. 迷人的圖形, 伊恩·斯圖爾特, 中信出版集團(tuán)·鸚鵡螺工作室, 2019-3出版
之前看了Mahout官方示例 20news 的調(diào)用實(shí)現(xiàn);于是想根據(jù)示例的流程實(shí)現(xiàn)其他例子。網(wǎng)上看到了一個(gè)關(guān)于天氣適不適合打羽毛球的例子。
訓(xùn)練數(shù)據(jù):
Day Outlook Temperature Humidity Wind PlayTennis
D1 Sunny Hot High Weak No
D2 Sunny Hot High Strong No
D3 Overcast Hot High Weak Yes
D4 Rain Mild High Weak Yes
D5 Rain Cool Normal Weak Yes
D6 Rain Cool Normal Strong No
D7 Overcast Cool Normal Strong Yes
D8 Sunny Mild High Weak No
D9 Sunny Cool Normal Weak Yes
D10 Rain Mild Normal Weak Yes
D11 Sunny Mild Normal Strong Yes
D12 Overcast Mild High Strong Yes
D13 Overcast Hot Normal Weak Yes
D14 Rain Mild High Strong No
檢測數(shù)據(jù):
sunny,hot,high,weak
結(jié)果:
Yes=》 0.007039
No=》 0.027418
于是使用Java代碼調(diào)用Mahout的工具類實(shí)現(xiàn)分類。
基本思想:
1. 構(gòu)造分類數(shù)據(jù)。
2. 使用Mahout工具類進(jìn)行訓(xùn)練,得到訓(xùn)練模型。
3。將要檢測數(shù)據(jù)轉(zhuǎn)換成vector數(shù)據(jù)。
4. 分類器對vector數(shù)據(jù)進(jìn)行分類。
接下來貼下我的代碼實(shí)現(xiàn)=》
1. 構(gòu)造分類數(shù)據(jù):
在hdfs主要?jiǎng)?chuàng)建一個(gè)文件夾路徑 /zhoujainfeng/playtennis/input 并將分類文件夾 no 和 yes 的數(shù)據(jù)傳到hdfs上面。
數(shù)據(jù)文件格式,如D1文件內(nèi)容: Sunny Hot High Weak
2. 使用Mahout工具類進(jìn)行訓(xùn)練,得到訓(xùn)練模型。
3。將要檢測數(shù)據(jù)轉(zhuǎn)換成vector數(shù)據(jù)。
4. 分類器對vector數(shù)據(jù)進(jìn)行分類。
這三步,代碼我就一次全貼出來;主要是兩個(gè)類 PlayTennis1 和 BayesCheckData = =》
package myTesting.bayes;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.util.ToolRunner;
import org.apache.mahout.classifier.naivebayes.training.TrainNaiveBayesJob;
import org.apache.mahout.text.SequenceFilesFromDirectory;
import org.apache.mahout.vectorizer.SparseVectorsFromSequenceFiles;
public class PlayTennis1 {
private static final String WORK_DIR = "hdfs://192.168.9.72:9000/zhoujianfeng/playtennis";
/*
* 測試代碼
*/
public static void main(String[] args) {
//將訓(xùn)練數(shù)據(jù)轉(zhuǎn)換成 vector數(shù)據(jù)
makeTrainVector();
//產(chǎn)生訓(xùn)練模型
makeModel(false);
//測試檢測數(shù)據(jù)
BayesCheckData.printResult();
}
public static void makeCheckVector(){
//將測試數(shù)據(jù)轉(zhuǎn)換成序列化文件
try {
Configuration conf = new Configuration();
conf.addResource(new Path("/usr/local/hadoop/conf/core-site.xml"));
String input = WORK_DIR+Path.SEPARATOR+"testinput";
String output = WORK_DIR+Path.SEPARATOR+"tennis-test-seq";
Path in = new Path(input);
Path out = new Path(output);
FileSystem fs = FileSystem.get(conf);
if(fs.exists(in)){
if(fs.exists(out)){
//boolean參數(shù)是,是否遞歸刪除的意思
fs.delete(out, true);
}
SequenceFilesFromDirectory sffd = new SequenceFilesFromDirectory();
String[] params = new String[]{"-i",input,"-o",output,"-ow"};
ToolRunner.run(sffd, params);
}
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
System.out.println("文件序列化失敗!");
System.exit(1);
}
//將序列化文件轉(zhuǎn)換成向量文件
try {
Configuration conf = new Configuration();
conf.addResource(new Path("/usr/local/hadoop/conf/core-site.xml"));
String input = WORK_DIR+Path.SEPARATOR+"tennis-test-seq";
String output = WORK_DIR+Path.SEPARATOR+"tennis-test-vectors";
Path in = new Path(input);
Path out = new Path(output);
FileSystem fs = FileSystem.get(conf);
if(fs.exists(in)){
if(fs.exists(out)){
//boolean參數(shù)是,是否遞歸刪除的意思
fs.delete(out, true);
}
SparseVectorsFromSequenceFiles svfsf = new SparseVectorsFromSequenceFiles();
String[] params = new String[]{"-i",input,"-o",output,"-lnorm","-nv","-wt","tfidf"};
ToolRunner.run(svfsf, params);
}
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
System.out.println("序列化文件轉(zhuǎn)換成向量失敗!");
System.out.println(2);
}
}
public static void makeTrainVector(){
//將測試數(shù)據(jù)轉(zhuǎn)換成序列化文件
try {
Configuration conf = new Configuration();
conf.addResource(new Path("/usr/local/hadoop/conf/core-site.xml"));
String input = WORK_DIR+Path.SEPARATOR+"input";
String output = WORK_DIR+Path.SEPARATOR+"tennis-seq";
Path in = new Path(input);
Path out = new Path(output);
FileSystem fs = FileSystem.get(conf);
if(fs.exists(in)){
if(fs.exists(out)){
//boolean參數(shù)是,是否遞歸刪除的意思
fs.delete(out, true);
}
SequenceFilesFromDirectory sffd = new SequenceFilesFromDirectory();
String[] params = new String[]{"-i",input,"-o",output,"-ow"};
ToolRunner.run(sffd, params);
}
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
System.out.println("文件序列化失敗!");
System.exit(1);
}
//將序列化文件轉(zhuǎn)換成向量文件
try {
Configuration conf = new Configuration();
conf.addResource(new Path("/usr/local/hadoop/conf/core-site.xml"));
String input = WORK_DIR+Path.SEPARATOR+"tennis-seq";
String output = WORK_DIR+Path.SEPARATOR+"tennis-vectors";
Path in = new Path(input);
Path out = new Path(output);
FileSystem fs = FileSystem.get(conf);
if(fs.exists(in)){
if(fs.exists(out)){
//boolean參數(shù)是,是否遞歸刪除的意思
fs.delete(out, true);
}
SparseVectorsFromSequenceFiles svfsf = new SparseVectorsFromSequenceFiles();
String[] params = new String[]{"-i",input,"-o",output,"-lnorm","-nv","-wt","tfidf"};
ToolRunner.run(svfsf, params);
}
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
System.out.println("序列化文件轉(zhuǎn)換成向量失敗!");
System.out.println(2);
}
}
public static void makeModel(boolean completelyNB){
try {
Configuration conf = new Configuration();
conf.addResource(new Path("/usr/local/hadoop/conf/core-site.xml"));
String input = WORK_DIR+Path.SEPARATOR+"tennis-vectors"+Path.SEPARATOR+"tfidf-vectors";
String model = WORK_DIR+Path.SEPARATOR+"model";
String labelindex = WORK_DIR+Path.SEPARATOR+"labelindex";
Path in = new Path(input);
Path out = new Path(model);
Path label = new Path(labelindex);
FileSystem fs = FileSystem.get(conf);
if(fs.exists(in)){
if(fs.exists(out)){
//boolean參數(shù)是,是否遞歸刪除的意思
fs.delete(out, true);
}
if(fs.exists(label)){
//boolean參數(shù)是,是否遞歸刪除的意思
fs.delete(label, true);
}
TrainNaiveBayesJob tnbj = new TrainNaiveBayesJob();
String[] params =null;
if(completelyNB){
params = new String[]{"-i",input,"-el","-o",model,"-li",labelindex,"-ow","-c"};
}else{
params = new String[]{"-i",input,"-el","-o",model,"-li",labelindex,"-ow"};
}
ToolRunner.run(tnbj, params);
}
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
System.out.println("生成訓(xùn)練模型失敗!");
System.exit(3);
}
}
}
package myTesting.bayes;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;
import org.apache.commons.lang.StringUtils;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.fs.PathFilter;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.mahout.classifier.naivebayes.BayesUtils;
import org.apache.mahout.classifier.naivebayes.NaiveBayesModel;
import org.apache.mahout.classifier.naivebayes.StandardNaiveBayesClassifier;
import org.apache.mahout.common.Pair;
import org.apache.mahout.common.iterator.sequencefile.PathType;
import org.apache.mahout.common.iterator.sequencefile.SequenceFileDirIterable;
import org.apache.mahout.math.RandomAccessSparseVector;
import org.apache.mahout.math.Vector;
import org.apache.mahout.math.Vector.Element;
import org.apache.mahout.vectorizer.TFIDF;
import com.google.common.collect.ConcurrentHashMultiset;
import com.google.common.collect.Multiset;
public class BayesCheckData {
private static StandardNaiveBayesClassifier classifier;
private static Map<String, Integer> dictionary;
private static Map<Integer, Long> documentFrequency;
private static Map<Integer, String> labelIndex;
public void init(Configuration conf){
try {
String modelPath = "/zhoujianfeng/playtennis/model";
String dictionaryPath = "/zhoujianfeng/playtennis/tennis-vectors/dictionary.file-0";
String documentFrequencyPath = "/zhoujianfeng/playtennis/tennis-vectors/df-count";
String labelIndexPath = "/zhoujianfeng/playtennis/labelindex";
dictionary = readDictionnary(conf, new Path(dictionaryPath));
documentFrequency = readDocumentFrequency(conf, new Path(documentFrequencyPath));
labelIndex = BayesUtils.readLabelIndex(conf, new Path(labelIndexPath));
NaiveBayesModel model = NaiveBayesModel.materialize(new Path(modelPath), conf);
classifier = new StandardNaiveBayesClassifier(model);
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
System.out.println("檢測數(shù)據(jù)構(gòu)造成vectors初始化時(shí)報(bào)錯(cuò)。。。。");
System.exit(4);
}
}
/**
* 加載字典文件,Key: TermValue; Value:TermID
* @param conf
* @param dictionnaryDir
* @return
*/
private static Map<String, Integer> readDictionnary(Configuration conf, Path dictionnaryDir) {
Map<String, Integer> dictionnary = new HashMap<String, Integer>();
PathFilter filter = new PathFilter() {
@Override
public boolean accept(Path path) {
String name = path.getName();
return name.startsWith("dictionary.file");
}
};
for (Pair<Text, IntWritable> pair : new SequenceFileDirIterable<Text, IntWritable>(dictionnaryDir, PathType.LIST, filter, conf)) {
dictionnary.put(pair.getFirst().toString(), pair.getSecond().get());
}
return dictionnary;
}
/**
* 加載df-count目錄下TermDoc頻率文件,Key: TermID; Value:DocFreq
* @param conf
* @param dictionnaryDir
* @return
*/
private static Map<Integer, Long> readDocumentFrequency(Configuration conf, Path documentFrequencyDir) {
Map<Integer, Long> documentFrequency = new HashMap<Integer, Long>();
PathFilter filter = new PathFilter() {
@Override
public boolean accept(Path path) {
return path.getName().startsWith("part-r");
}
};
for (Pair<IntWritable, LongWritable> pair : new SequenceFileDirIterable<IntWritable, LongWritable>(documentFrequencyDir, PathType.LIST, filter, conf)) {
documentFrequency.put(pair.getFirst().get(), pair.getSecond().get());
}
return documentFrequency;
}
public static String getCheckResult(){
Configuration conf = new Configuration();
conf.addResource(new Path("/usr/local/hadoop/conf/core-site.xml"));
String classify = "NaN";
BayesCheckData cdv = new BayesCheckData();
cdv.init(conf);
System.out.println("init done...............");
Vector vector = new RandomAccessSparseVector(10000);
TFIDF tfidf = new TFIDF();
//sunny,hot,high,weak
Multiset<String> words = ConcurrentHashMultiset.create();
words.add("sunny",1);
words.add("hot",1);
words.add("high",1);
words.add("weak",1);
int documentCount = documentFrequency.get(-1).intValue(); // key=-1時(shí)表示總文檔數(shù)
for (Multiset.Entry<String> entry : words.entrySet()) {
String word = entry.getElement();
int count = entry.getCount();
Integer wordId = dictionary.get(word); // 需要從dictionary.file-0文件(tf-vector)下得到wordID,
if (StringUtils.isEmpty(wordId.toString())){
continue;
}
if (documentFrequency.get(wordId) == null){
continue;
}
Long freq = documentFrequency.get(wordId);
double tfIdfValue = tfidf.calculate(count, freq.intValue(), 1, documentCount);
vector.setQuick(wordId, tfIdfValue);
}
// 利用貝葉斯算法開始分類,并提取得分最好的分類label
Vector resultVector = classifier.classifyFull(vector);
double bestScore = -Double.MAX_VALUE;
int bestCategoryId = -1;
for(Element element: resultVector.all()) {
int categoryId = element.index();
double score = element.get();
System.out.println("categoryId:"+categoryId+" score:"+score);
if (score > bestScore) {
bestScore = score;
bestCategoryId = categoryId;
}
}
classify = labelIndex.get(bestCategoryId)+"(categoryId="+bestCategoryId+")";
return classify;
}
public static void printResult(){
System.out.println("檢測所屬類別是:"+getCheckResult());
}
}
1. 請介紹一下WebGIS的概念和作用,以及在實(shí)際應(yīng)用中的優(yōu)勢和挑戰(zhàn)。
WebGIS是一種基于Web技術(shù)的地理信息系統(tǒng),通過將地理數(shù)據(jù)和功能以可視化的方式呈現(xiàn)在Web瀏覽器中,實(shí)現(xiàn)地理空間數(shù)據(jù)的共享和分析。它可以用于地圖瀏覽、空間查詢、地理分析等多種應(yīng)用場景。WebGIS的優(yōu)勢包括易于訪問、跨平臺(tái)、實(shí)時(shí)更新、可定制性強(qiáng)等,但也面臨著數(shù)據(jù)安全性、性能優(yōu)化、用戶體驗(yàn)等挑戰(zhàn)。
2. 請談?wù)勀赪ebGIS開發(fā)方面的經(jīng)驗(yàn)和技能。
我在WebGIS開發(fā)方面有豐富的經(jīng)驗(yàn)和技能。我熟悉常用的WebGIS開發(fā)框架和工具,如ArcGIS API for JavaScript、Leaflet、OpenLayers等。我能夠使用HTML、CSS和JavaScript等前端技術(shù)進(jìn)行地圖展示和交互設(shè)計(jì),并能夠使用后端技術(shù)如Python、Java等進(jìn)行地理數(shù)據(jù)處理和分析。我還具備數(shù)據(jù)庫管理和地理空間數(shù)據(jù)建模的能力,能夠設(shè)計(jì)和優(yōu)化WebGIS系統(tǒng)的架構(gòu)。
3. 請描述一下您在以往項(xiàng)目中使用WebGIS解決的具體問題和取得的成果。
在以往的項(xiàng)目中,我使用WebGIS解決了許多具體問題并取得了顯著的成果。例如,在一次城市規(guī)劃項(xiàng)目中,我開發(fā)了一個(gè)基于WebGIS的交通流量分析系統(tǒng),幫助規(guī)劃師們評估不同交通方案的效果。另外,在一次環(huán)境監(jiān)測項(xiàng)目中,我使用WebGIS技術(shù)實(shí)現(xiàn)了實(shí)時(shí)的空氣質(zhì)量監(jiān)測和預(yù)警系統(tǒng),提供了準(zhǔn)確的空氣質(zhì)量數(shù)據(jù)和可視化的分析結(jié)果,幫助政府和公眾做出相應(yīng)的決策。
4. 請談?wù)勀鷮ebGIS未來發(fā)展的看法和期望。
我認(rèn)為WebGIS在未來會(huì)繼續(xù)發(fā)展壯大。隨著云計(jì)算、大數(shù)據(jù)和人工智能等技術(shù)的不斷進(jìn)步,WebGIS將能夠處理更大規(guī)模的地理數(shù)據(jù)、提供更豐富的地理分析功能,并與其他領(lǐng)域的技術(shù)進(jìn)行深度融合。我期望未來的WebGIS能夠更加智能化、個(gè)性化,為用戶提供更好的地理信息服務(wù),助力各行各業(yè)的決策和發(fā)展。
這塊您需要了解下stm32等單片機(jī)的基本編程和簡單的硬件設(shè)計(jì),最好能夠了解模電和數(shù)電相關(guān)的知識更好,還有能夠會(huì)做操作系統(tǒng),簡單的有ucos,freeRTOS等等。最好能夠使用PCB畫圖軟件以及keil4等軟件。希望對您能夠有用。
1.負(fù)責(zé)區(qū)域大客戶/行業(yè)客戶管理系統(tǒng)銷售拓展工作,并完成銷售流程;
2.維護(hù)關(guān)鍵客戶關(guān)系,與客戶決策者保持良好的溝通;
3.管理并帶領(lǐng)團(tuán)隊(duì)完成完成年度銷售任務(wù)。
你好,面試題類型有很多,以下是一些常見的類型:
1. 技術(shù)面試題:考察候選人技術(shù)能力和經(jīng)驗(yàn)。
2. 行為面試題:考察候選人在過去的工作或生活中的行為表現(xiàn),以預(yù)測其未來的表現(xiàn)。
3. 情境面試題:考察候選人在未知情境下的決策能力和解決問題的能力。
4. 案例面試題:考察候選人解決實(shí)際問題的能力,模擬真實(shí)工作場景。
5. 邏輯推理題:考察候選人的邏輯思維能力和分析能力。
6. 開放性面試題:考察候選人的個(gè)性、價(jià)值觀以及溝通能力。
7. 挑戰(zhàn)性面試題:考察候選人的應(yīng)變能力和創(chuàng)造力,通常是一些非常具有挑戰(zhàn)性的問題。
需要具體分析 因?yàn)閏ocoscreator是一款游戲引擎,面試時(shí)的問題會(huì)涉及到不同的方面,如開發(fā)經(jīng)驗(yàn)、游戲設(shè)計(jì)、圖形學(xué)等等,具體要求也會(huì)因公司或崗位而異,所以需要根據(jù)實(shí)際情況進(jìn)行具體分析。 如果是針對開發(fā)經(jīng)驗(yàn)的問題,可能會(huì)考察候選人是否熟悉cocoscreator常用API,是否能夠獨(dú)立開發(fā)小型游戲等等;如果是針對游戲設(shè)計(jì)的問題,則需要考察候選人對游戲玩法、關(guān)卡設(shè)計(jì)等等方面的理解和能力。因此,需要具體分析才能得出準(zhǔn)確的回答。
以下是一些可能出現(xiàn)在MyCat面試中的問題:
1. 什么是MyCat?MyCat是一個(gè)開源的分布式數(shù)據(jù)庫中間件,它可以將多個(gè)MySQL數(shù)據(jù)庫組合成一個(gè)邏輯上的數(shù)據(jù)庫集群,提供高可用性、高性能、易擴(kuò)展等特性。
2. MyCat的優(yōu)勢是什么?MyCat具有以下優(yōu)勢:支持讀寫分離、支持分庫分表、支持自動(dòng)切換故障節(jié)點(diǎn)、支持SQL解析和路由、支持?jǐn)?shù)據(jù)分片等。
3. MyCat的架構(gòu)是怎樣的?MyCat的架構(gòu)包括三個(gè)層次:客戶端層、中間件層和數(shù)據(jù)存儲(chǔ)層。客戶端層負(fù)責(zé)接收和處理客戶端請求,中間件層負(fù)責(zé)SQL解析和路由,數(shù)據(jù)存儲(chǔ)層負(fù)責(zé)實(shí)際的數(shù)據(jù)存儲(chǔ)和查詢。
4. MyCat支持哪些數(shù)據(jù)庫?MyCat目前支持MySQL和MariaDB數(shù)據(jù)庫。
5. MyCat如何實(shí)現(xiàn)讀寫分離?MyCat通過將讀請求和寫請求分別路由到不同的MySQL節(jié)點(diǎn)上實(shí)現(xiàn)讀寫分離。讀請求可以路由到多個(gè)只讀節(jié)點(diǎn)上,從而提高查詢性能。
6. MyCat如何實(shí)現(xiàn)分庫分表?MyCat通過對SQL進(jìn)行解析和路由,將數(shù)據(jù)按照一定規(guī)則劃分到不同的數(shù)據(jù)庫或表中,從而實(shí)現(xiàn)分庫分表。
7. MyCat如何保證數(shù)據(jù)一致性?MyCat通過在多個(gè)MySQL節(jié)點(diǎn)之間同步數(shù)據(jù),保證數(shù)據(jù)的一致性。同時(shí),MyCat還支持自動(dòng)切換故障節(jié)點(diǎn),從而保證系統(tǒng)的高可用性。
8. MyCat的部署方式有哪些?MyCat可以部署在單機(jī)上,也可以部署在多臺(tái)服務(wù)器上實(shí)現(xiàn)分布式部署。
孩子送男孩子雪花酥,代表著這個(gè)女孩子可能會(huì)非常的喜歡這個(gè)男孩子,因?yàn)檠┗ㄋ诌@種零食,他是非常的甜的,非常甜的食物,往往代表著一種甜甜蜜蜜的情感,所以說女孩子送男孩子,送男孩子喜歡送,可能是比較喜歡你,而且愿意和你成為更進(jìn)一步的關(guān)系
目前雪花啤酒旗下的主力品牌(勇闖天涯superX、雪花馬爾斯綠、匠心營造、臉譜系列)之外,華潤雪花啤酒還擁有黑獅白啤、黑獅果啤、拉維邦黑啤等個(gè)性化品牌,以及果味水啤酒樣的小啤汽。可以說現(xiàn)在雪花啤酒旗下產(chǎn)品越來越完善了。