跳轉到內容

用 Linkbot 學習 Python 3 / 列表進階

來自 Wikibooks,開放世界開放書籍

我們已經瞭解了列表以及如何使用它們。現在你已經具備了一些基礎知識,我將更詳細地介紹列表。首先,我們將探索更多訪問列表元素的方法,然後我們將討論如何複製它們。

以下是一些使用索引訪問列表單個元素的示例

>>> some_numbers = ['zero', 'one', 'two', 'three', 'four', 'five']
>>> some_numbers[0]
'zero'
>>> some_numbers[4]
'four'
>>> some_numbers[5]
'five'

所有這些示例對你來說應該很熟悉。如果你想獲取列表中的第一個專案,只需檢視索引 0。第二個專案是索引 1,以此類推。但是,如果你想獲取列表中的最後一個專案怎麼辦?一種方法是使用 len() 函式,例如 some_numbers[len(some_numbers) - 1]。這種方法有效,因為 len() 函式始終返回最後一個索引加 1。那麼倒數第二個專案就是 some_numbers[len(some_numbers) - 2]。但有一種更簡單的方法。在 Python 中,最後一個專案始終是索引 -1。倒數第二個是索引 -2,以此類推。以下是一些更多示例

>>> some_numbers[len(some_numbers) - 1]
'five'
>>> some_numbers[len(some_numbers) - 2]
'four'
>>> some_numbers[-1]
'five'
>>> some_numbers[-2]
'four'
>>> some_numbers[-6]
'zero'

因此,列表中的任何專案都可以透過兩種方式進行索引:從前面和從後面。

另一種訪問列表部分的有用方法是使用切片。以下是一個示例,讓你瞭解它們的使用場景

>>> things = [0, 'Fred', 2, 'S.P.A.M.', 'Stocking', 42, "Jack", "Jill"]
>>> things[0]
0
>>> things[7]
'Jill'
>>> things[0:8]
[0, 'Fred', 2, 'S.P.A.M.', 'Stocking', 42, 'Jack', 'Jill']
>>> things[2:4]
[2, 'S.P.A.M.']
>>> things[4:7]
['Stocking', 42, 'Jack']
>>> things[1:5]
['Fred', 2, 'S.P.A.M.', 'Stocking']

切片用於返回列表的一部分。切片運算子的形式為 things[first_index:last_index]。切片在 first_index 之前和 last_index 之前切割列表,並返回中間的部分。你可以使用兩種型別的索引

>>> things[-4:-2]
['Stocking', 42]
>>> things[-4]
'Stocking'
>>> things[-4:6]
['Stocking', 42]

切片另一個技巧是未指定索引。如果未指定第一個索引,則假定為列表的開頭。如果未指定最後一個索引,則假定為整個剩餘列表。以下是一些示例

>>> things[:2]
[0, 'Fred']
>>> things[-2:]
['Jack', 'Jill']
>>> things[:3]
[0, 'Fred', 2]
>>> things[:-5]
[0, 'Fred', 2]

這是一個(受 HTML 啟發)的程式示例(如果你想的話,可以將詩歌定義複製貼上進去)

poem = ["<B>", "Jack", "and", "Jill", "</B>", "went", "up", "the",
        "hill", "to", "<B>", "fetch", "a", "pail", "of", "</B>",
        "water.", "Jack", "fell", "<B>", "down", "and", "broke",
        "</B>", "his", "crown", "and", "<B>", "Jill", "came",
        "</B>", "tumbling", "after"]

def get_bolds(text):
    true = 1
    false = 0
    ## is_bold tells whether or not we are currently looking at 
    ## a bold section of text.
    is_bold = false
    ## start_block is the index of the start of either an unbolded 
    ## segment of text or a bolded segment.
    start_block = 0
    for index in range(len(text)):
        ## Handle a starting of bold text
        if text[index] == "<B>":
            if is_bold:
                print("Error: Extra Bold")
            ## print "Not Bold:", text[start_block:index]
            is_bold = true
            start_block = index + 1
        ## Handle end of bold text
        ## Remember that the last number in a slice is the index 
        ## after the last index used.
        if text[index] == "</B>":
            if not is_bold:
                print("Error: Extra Close Bold")
            print("Bold [", start_block, ":", index, "]", text[start_block:index])
            is_bold = false
            start_block = index + 1

get_bolds(poem)

輸出結果為

Bold [ 1 : 4 ] ['Jack', 'and', 'Jill']
Bold [ 11 : 15 ] ['fetch', 'a', 'pail', 'of']
Bold [ 20 : 23 ] ['down', 'and', 'broke']
Bold [ 28 : 30 ] ['Jill', 'came']

get_bold() 函式接受一個被分成單詞和標記的列表。它查詢的標記是 <B>,它表示粗體文字的開始,以及 </B>,它表示粗體文字的結束。get_bold() 函式遍歷列表,搜尋開始和結束標記。

列表的下一個特性是複製它們。如果你嘗試像下面這樣簡單的方法

>>> a = [1, 2, 3]
>>> b = a
>>> print(b)
[1, 2, 3]
>>> b[1] = 10
>>> print(b)
[1, 10, 3]
>>> print(a)
[1, 10, 3]

這可能看起來令人驚訝,因為對 b 的修改也導致了 a 的改變。發生的情況是語句 b = a 使 b 成為 a引用。這意味著 b 可以被認為是 a 的另一個名稱。因此,對 b 的任何修改都會改變 a。但是,有些賦值不會為一個列表建立兩個名稱

>>> a = [1, 2, 3]
>>> b = a * 2
>>> print(a)
[1, 2, 3]
>>> print(b)
[1, 2, 3, 1, 2, 3]
>>> a[1] = 10
>>> print(a)
[1, 10, 3]
>>> print(b)
[1, 2, 3, 1, 2, 3]

在這種情況下,b 不是 a 的引用,因為表示式 a * 2 建立了一個新的列表。然後語句 b = a * 2 使 b 成為 a * 2 的引用,而不是 a 的引用。所有賦值操作都會建立一個引用。當你將一個列表作為引數傳遞給一個函式時,你也會建立一個引用。大多數情況下,你無需擔心建立引用而不是副本。但是,當你需要修改一個列表而不改變該列表的其他名稱時,你必須確保你實際上已經建立了一個副本。

有多種方法可以建立列表的副本。最簡單且大多數情況下有效的方法是使用切片運算子,因為它始終會建立一個新的列表,即使它是一個整個列表的切片

>>> a = [1, 2, 3]
>>> b = a[:]
>>> b[1] = 10
>>> print(a)
[1, 2, 3]
>>> print(b)
[1, 10, 3]

獲取切片 [:] 會建立一個列表的新副本。但是,它只複製外層列表。內部的任何子列表仍然是原始列表中子列表的引用。因此,當列表包含列表時,必須複製內層列表。你可以手動執行此操作,但 Python 已經包含一個模組來完成它。你可以使用 copy 模組的 deepcopy 函式

>>> import copy
>>> a = [[1, 2, 3], [4, 5, 6]]
>>> b = a[:]
>>> c = copy.deepcopy(a)
>>> b[0][1] = 10
>>> c[1][1] = 12
>>> print(a)
[[1, 10, 3], [4, 5, 6]]
>>> print(b)
[[1, 10, 3], [4, 5, 6]]
>>> print(c)
[[1, 2, 3], [4, 12, 6]]

首先,請注意 a 是一個包含列表的列表。然後請注意,當執行 b[0][1] = 10 時,ab 都發生了改變,但 c 沒有。這是因為使用切片運算子時,內層陣列仍然是引用。但是,使用 deepcopyc 被完全複製了。

那麼,每次使用函式或 = 時,我都要擔心引用嗎?好訊息是,你只需要在使用字典和列表時擔心引用。數字和字串在賦值時會建立引用,但對數字和字串的任何修改操作都會建立一個新的副本,因此你永遠不會意外地修改它們。當你修改列表或字典時,你確實需要考慮引用。

到目前為止,你可能想知道為什麼使用引用?主要原因是速度。建立對包含一千個元素的列表的引用比複製所有元素快得多。另一個原因是它允許你建立一個函式來修改輸入的列表或字典。只要記住引用,如果你遇到一些奇怪的資料改變問題,而它不應該改變。


用 Linkbot 學習 Python 3
 ← 使用模組 列表進階 字串的復仇 → 
華夏公益教科書