Scala学习笔记——基础

不适合人类阅读的学习笔记

编译环境

scala在终端中就可以调用解释器，与python类似，可以逐语句执行。使用命令scala即可进入终端解释器，使用命令:q或者:quit退出解释器。
编译首选jetbrain的intellij IDEA，下载一个Scala plugin，然后选择创建maven工程，main函数应当写在object文件中，object通过创建Scala class文件选项创建。
如果要写分布式处理程序的话，需要自己重写配置文件
Scala注释与C++类似

让intellij默认不打开上个项目的方法

settings>Apperance&Behavior>System Settings 将Reopen last project on startup 勾去掉即可.

在intellij IDEA下创建scala项目的步骤

首先，要确保已经安装了scala的插件(这个有很大概率会安装失败，如果失败次数太多可以选择离线安装，或者跳过scala sdk的选择，在进入一个scala项目之后选择补全)
然后，在欢迎页面的右下角点击Configure，然后在Project Defaults的下拉菜单中选择Project Structure，在打开的页面左侧选择Global Libraries，然后在中间一栏中有一个绿色的加号标志 +，点击后在下拉菜单中选择 Scala SDK
然后在打开的对话框中选择系统本身所安装的Scala（即System对应的版本），点击OK确定，这时候会在中间一栏位置处出现Scala的SDK，在其上右键点击后选择Copy to Project Libraries…，这个操作是为了将Scala SDK添加到项目的默认Library中去。
在欢迎界面点击Create New Project，在打开的页面左侧边栏中，选择Maven，然后在右侧的Project SDK一项中，查看是否是正确的JDK配置项正常来说这一栏会自动填充的，因为我们之前在1.3中已经配置过了全局的Project JDK了，如果这里没有正常显示JDK的话，可以点击右侧的New…按钮，然后指定JDK安装路径的根目录即可）。注意不要选择create from archetype

然后点击Next，来到Maven项目最重要三个参数的设置页面，这三个参数分别为：GroupId, ArtifactId和Version.

创建Hello world

为了让体验Scala更清爽一些，将一些暂时无关的文件和文件夹都删除掉，主要有 main/java, main/resources 和 test 这三个文件夹
将Scala的框架添加到这个项目中，方法是在左侧栏中的 项目名称 上右键菜单中点击 Add Framework Support…，然后在打开的对话框左侧边栏中，勾选Scala前面的复选框，然后点击确定即可（前提是上文中所述步骤都已正确走通，否则你很有可能看不到Scala这个选项的）；
在main文件夹中建立一个名为 scala 的文件夹，并右键点击 scala 文件夹，选择 Make Directory as，然后选择Sources Root ，这里主要意思是将 scala 文件夹标记为一个源文件的根目录，然后在其内的所有代码中的 package ，其路径就从这个根目录下开始算起。
在已经标记好为源文件根目录的 scala 文件夹上，右键选择 New，然后选择 Scala Class，随后设置好程序的名称，并且记得将其设置为一个 Object(类似于Java中含有静态成员的静态类)，正常的话，将会打开这个 Object 代码界面，并且可以看到IntelliJ IDEA自动添加了一些最基本的信息；

示例程序

object HelloWorld {
   def main(args: Array[String]) {
      println("Hello, world!") // 输出 Hello World
   }
}

执行scala程序

脚本执行：我们可以将 Scala 表达式写在一个文件里，比如 Hello.scala。在命令行中直接输入 scala Hello.scala
作为应用程序执行：作为应用程序执行时，我们需要在一个单例对象中定义入口函数 main，经过编译后就可以执行该应用程序了。

基础

scala的语句分号规则与C++相类似(一般都不用加，加了一般也不会错)

scala中的通配符为_，而C++中为`*``

scala与spark很契合，所以写spark程序推荐使用scala语言

变量

Scala中变量分为可变变量和不可变变量。可变变量用关键字var修饰，不可变变量用val修饰。

注意scala中变量定义时必须赋初始值
scala大多数数据结构中的变量默认为val类型
特例：若用占位符_作为值进行初始化，则String类会被初始化为null,Float,Int,Double等被初始化为0,Char类型会被初始化为”?”.
如果用lazy关键字修饰变量，则他只有在真正被使用时才会被赋值。

注意lazy关键字只能修饰val类型变量，不能修饰var类型

输入输出

输出：`print("...")` 或者 `println("...")`

输入：

注意，控制台的输入均为string类型，需要在后面加上.toInt .toFloat等转换操作

控制台输入：

val scan = scala.io.StdIn  //设置scan
val n = scan.readLine.trim.toInt  //输入一个int
val arr = scan.readLine.split(" ").map(_.trim.toInt)  //输入一串数字，之间以空格间隔
// .trim方法是去掉输入字符串两旁的空格

scala还有一系列专门的用来读下一个输入并且可以自动转换的方法，例如：

val scan = scala.io.StdIn
val myint = scan.readInt()
val myfloat = scan.readFloat()
val myboolean = scan.readBoolean()
...
//这些方法均可以读取下一个输入并且自动转换类型

排序

例如：

val a = new Array[Int](3)
a(0)  =1
a(1) = 2
a(2) = 0
a.foreach(print)  //结果: 120
val sorted_a = a.sortWith((x,y) => x > y)  //从大到小排序（sortWith的参数为一个lambda函数，返回一个布尔值用于比较）
a.foreach(print) //结果： 210

一些注意点

scala中没有 ++ 操作，可以用 += 1 代替 ++（x += y ，y可以是一个数字，也可以是一个数字变量，但不能是数组或是其他一些类似结构的某个元素）
Scala所有数据类型首字母都要大写，因为Scala中所有值类型都是对象，其中布尔类型应写为“Boolean”
Scala中有 <= 和 >= 以及逻辑与 && 和逻辑或 || 运算符，与C++相同。
Scala中String类型就是Java中的String.lang.String类型，因此可以调用Java中String的所有方法（例：str.reverse表示字符逆序）
Scala中有一类特殊的运算符 “::”(list构造)，”:::”(list拼接)，他们是右操作。例如：a::b::Nill执行顺序为(a::(b::Nill))

一些数据类型

整型和浮点型

整型字面量用于 Int 类型，如果表示 Long，可以在数字后面添加 L 或者小写 l 作为后缀。
如果浮点数后面有f或者F后缀时，表示这是一个Float类型，否则就是一个Double类型的。

符号字面量

也就是符号类型
符号字面量被写成： ‘<标识符> ，这里 <标识符> 可以是任何字母或数字的标识（注意：不能以数字开头）。这种字面量被映射成预定义类scala.Symbol的实例。

string类

一个Array[String]类型的数据使用 .toString方法后得到的是一个java.lang.string类型的数据，这个数据直接print是这个Array的地址（一堆符号）
string类的substring方法，有两个参数，第一个参数为起始位置，第二个参数为结束位置，可以不写，默认为末尾
通常，toString 方法会返回一个“以文本方式表示”此对象的字符串。结果应是一个简明但易于读懂的信息表达式。建议所有子类都重写此方法。
Object 类的 toString 方法返回一个字符串，该字符串由类名（对象是该类的一个实例）、at 标记符“@”和此对象哈希码的无符号十六进制表示组成。换句话说，该方法返回一个字符串，它的值等于：
1
getClass().getName() + '@' + Integer.toHexString(hashCode())
将java.lang.string以可读的形式打印出来的方法：

元组类型（类似于Python中的元组）

如果想要访问元组的内容，可以通过 变量名._N的方式进行。其中N表示元组中元素的索引号。例：tuple._1 表示tuple中的第一个元素。
注意：元组的访问元素的索引是从1开始，而且是不可改变的。
元组用 == 进行比较时，是进行内容的比较，这与String类型一致。

数组

数组的索引是从0开始的

声明格式：

1 2	val a: Array[String] = new Array[String](3) 或者： val a = new Array[String](3)

赋值： a(0) = "abc" //注意即使是声明为val变量，数组a的元素的值也是可以改变的。 同时，使用索引时数组名后面跟的是圆括号而不是方括号，这点与C++不同，切记
可以使用foreach()方法实现遍历。

List

创建List:

1 2	val a = List.apply("1","2","3") val a: List[String] = List("1","2","3")

流程控制结构

判断语句

if语句格式：

if(条件判断){
	[...] //条件判断为真时执行
}
else{
	[...] //条件判断为假时执行
}  //也可以写成 if(){...} else if(){...} 同C++

与Java，C++不同的是，Scala中if语句可以作为表达式使用。例：
1
2
scala> val x = if("hello" == "hell") 1 else 0
x: Int = 0
从这个例子可以看出，if是个表达式，其返回值可以给变量赋值。Scala会将if语句的最后一条执行语句作为返回值

循环语句

while循环,do..while循环同C++
for循环格式：
1
2
3
for(i <- 表达式){
[...]
}

示例：

1
2
3

for(i <- 1 to 3){
	println("i = " + i);
}

结果： i = 1 i = 2 i = 3 (1 to 3 的集合是包含3的)
其中 ‘<-‘被称为生成器（generator），for循环实际上是通过集合的遍历来达到循环的目的的。
如果希望集合是右开的，可以使用1 until 5来实现，范围是[1,5)

还可以设置for 循环的步长。例：

1
2
3

for(i <- 1 until (10，2))
	println("i = " + i);
结果： i =1 i = 3 .... i = 9

不过，由于Scala是函数式编程，应当尽量使用迭代来代替循环
例如：使用 标识符.foreach()方法来实现对元素的遍历

最后更新于2018.5.27

编译环境

让intellij默认不打开上个项目的方法

在intellij IDEA下创建scala项目的步骤

创建Hello world

示例程序

执行scala程序

基础

变量

输入输出

输出：print("...") 或者 println("...")

输入：

排序

一些注意点

一些数据类型

整型和浮点型

符号字面量

string类

元组类型（类似于Python中的元组）

数组

List

流程控制结构

判断语句

循环语句

输出：`print("...")` 或者 `println("...")`