Python对象类型之字符串

Python对象类型之字符串

前言

着手开始写的时候就一直有一个画面在脑子中出现:小猪佩奇第N级,猪爸爸拿出来一本《混凝土的故事》,打开书的时候说道:混凝土是由砂子、水、水泥组成的,结果其他人都睡着了。于是,我在想,要是给土木人讲:python万法皆对象,对象类型有:

  • 数字:int,long,float,complex,bool
  • 字符:str,unicod
  • 列表:list
  • 字典:dict
  • 元组:tuple
  • 文件:file
  • 其他类型:集合(set),冻结集合(frozenset),类类型等。

是不是也有人睡着?相反,如果我直接说砂子、水泥、钢筋、混凝土,是不是觉得亲切?所以接下来将会从一砖一瓦的建筑材料说Python。

万法皆对象:在基建领域,你所看到的构筑物就是有以上提到的基础建材组成;在Python领域对象类型就可以看做基础建筑材料,然后由不同的施工工艺产生不同的单体模块或构造物。例如:一个函数(施工工艺)所包含的参数(基础建材),形成一个伪代码。


伪代码

#围墙条形基础开挖
变量类型:铲子、䦆头、羊角碾、块石、砖头、水泥、混凝土    
#工艺流程:
开挖条形基坑
夯实基础
抛填块片石
混凝土填充找平
砌砖
#以上即为面向过程编程,下面先说说数字类型。

真代码(字符串)

字符串

生成字符串

Python中可以使用一对单引号''或者双引号""生成字符串。

s = "hello, world"
print(s)
hello, world
s = 'hello world'
print(s)
hello world

简单操作

加法:

s = 'hello ' + 'world'
s
'hello world'

字符串与数字相乘:

"echo" * 3
'echoechoecho'

字符串长度:

len(s)
11

字符串方法

Python是一种面向对象的语言,面向对象的语言中一个必不可少的元素就是方法,而字符串是对象的一种,所以有很多可用的方法。

跟很多语言一样,Python使用以下形式来调用方法:

对象.方法(参数)

分割

s.split()将s按照空格(包括多个空格,制表符\t,换行符\n等)分割,并返回所有分割得到的字符串。

line = "1 2 3 4  5"
numbers = line.split()
print(numbers)
['1', '2', '3', '4', '5']

s.split(sep)以给定的sep为分隔符对s进行分割。

line = "1,2,3,4,5"
numbers = line.split(',')
print(numbers)
['1', '2', '3', '4', '5']

连接

与分割相反,s.join(str_sequence)的作用是以s为连接符将字符串序列str_sequence中的元素连接起来,并返回连接后得到的新字符串:

s = ' '
s.join(numbers)
'1 2 3 4 5'
s = ','
s.join(numbers)
'1,2,3,4,5'

替换

s.replace(part1, part2)将字符串s中指定的部分part1替换成想要的部分part2,并返回新的字符串。

s = "hello world"
s.replace('world', 'python')
'hello python'

此时,s的值并没有变化,替换方法只是生成了一个新的字符串。

s
'hello world'

大小写转换

s.upper()方法返回一个将s中的字母全部大写的新字符串。

s.lower()方法返回一个将s中的字母全部小写的新字符串。

"hello world".upper()
'HELLO WORLD'

这两种方法也不会改变原来s的值:

s = "HELLO WORLD"
print(s.lower())
print(s)
hello world
HELLO WORLD

去除多余空格

s.strip()返回一个将s两端的多余空格除去的新字符串。

s.lstrip()返回一个将s开头的多余空格除去的新字符串。

s.rstrip()返回一个将s结尾的多余空格除去的新字符串。

s = "  hello world   "
s.strip()
'hello world'

s的值依然不会变化:

s
'  hello world   '
s.lstrip()
'hello world   '
s.rstrip()
'  hello world'

更多方法

可以使用dir函数查看所有可以使用的方法:

dir(s)
['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getnewargs__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mod__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rmod__',
 '__rmul__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'capitalize',
 'casefold',
 'center',
 'count',
 'encode',
 'endswith',
 'expandtabs',
 'find',
 'format',
 'format_map',
 'index',
 'isalnum',
 'isalpha',
 'isdecimal',
 'isdigit',
 'isidentifier',
 'islower',
 'isnumeric',
 'isprintable',
 'isspace',
 'istitle',
 'isupper',
 'join',
 'ljust',
 'lower',
 'lstrip',
 'maketrans',
 'partition',
 'replace',
 'rfind',
 'rindex',
 'rjust',
 'rpartition',
 'rsplit',
 'rstrip',
 'split',
 'splitlines',
 'startswith',
 'strip',
 'swapcase',
 'title',
 'translate',
 'upper',
 'zfill']

多行字符串

Python 用一对 """ 或者 ''' 来生成多行字符串:

a = """hello world.
it is a nice day."""
print(a)
hello world.
it is a nice day.

在储存时,我们在两行字符间加上一个换行符 '\n'

a
'hello world.\nit is a nice day.'

使用 () 或者 \ 来换行

当代码太长或者为了美观起见时,我们可以使用两种方法来将一行代码转为多行代码:

  • ()
  • \
a = ("hello, world. "
    "it's a nice day. "
    "my name is xxx")
a
"hello, world. it's a nice day. my name is xxx"
a = "hello, world. " \
    "it's a nice day. " \
    "my name is xxx"
a
"hello, world. it's a nice day. my name is xxx"

强制转换为字符串

  • str(ob)强制将ob转化成字符串。
  • repr(ob)也是强制将ob转化成字符串。

不同点如下:

str(1.1 + 2.2)
'3.3000000000000003'
repr(1.1 + 2.2)
'3.3000000000000003'

整数与不同进制的字符串的转化

可以将整数按照不同进制转化为不同类型的字符串。

十六进制:

hex(255)
'0xff'

八进制:

oct(255)
'0o377'

二进制:

bin(255)
'0b11111111'

可以使用 int 将字符串转为整数:

int('23')
23

还可以指定按照多少进制来进行转换,最后返回十进制表达的整数:

int('FF', 16)
255
int('377', 8)
255
int('11111111', 2)
255

float 可以将字符串转换为浮点数:

float('3.5')
3.5

格式化字符串

Python用字符串的format()方法来格式化字符串。

具体用法如下,字符串中花括号 {} 的部分会被format传入的参数替代,传入的值可以是字符串,也可以是数字或者别的对象。

'{} {} {}'.format('a', 'b', 'c')
'a b c'

可以用数字指定传入参数的相对位置:

'{2} {1} {0}'.format('a', 'b', 'c')
'c b a'

还可以指定传入参数的名称:

'{color} {n} {x}'.format(n=10, x=1.5, color='blue')
'blue 10 1.5'

可以在一起混用:

'{color} {0} {x} {1}'.format(10, 'foo', x = 1.5, color='blue')
'blue 10 1.5 foo'

可以用{<field name>:<format>}指定格式:

from math import pi

'{0:10} {1:10d} {2:10.2f}'.format('foo', 5, 2 * pi)
'foo                 5       6.28'

具体规则与C中相同。

也可以使用旧式的 % 方法进行格式化:

s = "some numbers:"
x = 1.34
y = 2
# 用百分号隔开,括号括起来
t = "%s %f, %d" % (s, x, y)
t
'some numbers: 1.340000, 2'

土木狗的视角:字符串在实际生活中就如各种文字(非数字),关于字符串的操作更多上面的代码已经说得七七八八了,最常用的可能是字符串的切片或format格式化,前者类似于砌墙时候用的砖头,有时候就需要用到半块砖,用瓦刀切呗;format格式化就更形象了,把切好的半块砖头放到指定的位置{}。

关于撸码,我一直持一个观点:作为跨界散修者,更重要的是如果使用计算机领域前辈们造好的轮子;就像那块砖头一样,作为搬砖狗,我们只要知道砖头的类型(水泥砖、黏土砖)、尺寸(标准砖)、强度是否满足要求,而完全没有必要知道黏土是从哪来的、烧制砖头的温度(是过火转、还是非过火砖)、哪个砖厂的(止于运费、建材价格之类的是造价员和业主关心的)!


呵呵,说的有点绝对,你要是知道字符串在内存怎么存储,也是极好的!




课后作业(可选)

按上一节运行自己的项目,新建一个strings.ipynb文件,将上面代码敲入运行。


编辑于 2021-01-05 09:41